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8j Preface 
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我 们 很 高 兴 能 帮 你 尽快 并 尽 可 能 深入 地 学 习 Python。 掌 握 语法 是 本 书 的 一 个 目标 ， 不 管 怎 

样 ， 我 们 都 坚信 ， 哪 怕 是 一 个 初学 者 ， 只 要 他 能 掌握 Python 的 运作 机 理 ， 他 就 不 再 仅仅 是 用 
Python“ 编 写 ”"， 而 是 能 开发 出 更 高 效 的 Python 应 用 程序 。 但 是 你 知道 ， 并 不 是 掌握 了 一 门 语言 
的 语法 就 能 让 你 立刻 登 堂 入 室 。 


在 本 书 中 ， 你 能 发 现 许 多 可 以 立即 上 手 的 例子 。 为 了 巩固 基础 ， 你 还 会 在 每 章 的 末尾 找到 有 
趣 又 富有 挑战 性 的 习题 。 这 些 初级 和 中 级 水 平 的 习题 可 以 检验 你 的 学 习 效 果 ， 并 且 提 升 你 的 
Python 技巧 。 确 实 没 有 什么 能 代替 经 验 ， 我 们 只 是 想 尽量 用 最 短 的 时 间 让 你 不 止 初 涉 
Python， 而 且 能 学 会 驾驭 它 


o 


XTAT 


本 书 之 所 以 比 其 他 Python 书籍 畅销 ， 是 因为 它 拥有 广泛 的 选 题 、 丰 富 的 例子 和 必要 的 深入 解 
析 。 本 书 不 需要 你 拥有 C 语 言 或 者 面向 对 象 程序 设计 之 类 的 背景 。 本 书 同样 也 不 是 一 本 让 你 很 
难 入 门 的 个 案 解 析 。 最 后 ， 本 书 也 绝 非 一 本 纯粹 的 参考 书 或 者 快速 入 门 指南 。 你 手中 的 这 本 
书包 括 了 针对 这 门 语言 特性 的 包罗 万 象 的 介绍 (第 一 部 分 中 ) ， 通 过 其 下 各 章 你 可 以 洞悉 
Python 编 程 的 每 个 细节 。 


本 书 40% 是 介绍 ，40% 是 晋级 ， 余 下 的 20% 则 是 参考 。 我 们 将 目标 锁定 于 那些 已 经 熟悉 某 种 
其 他 高 级 语言 的 人 士 和 大 、 中 学 生 。 因 为 Python 可 以 应 用 于 Zope、Plone、MailMan 和 Dijango 
等 大 型 的 解决 方案 ， 所 以 本 书 可 能 被 主要 用 于 与 这 些 系 统 有 关 的 开发 、 管 理 、 维 护 和 整合 工 
作 。 


对 于 书 中 代码 的 关注 ， 第 一 版 大 约 三 分 之 一 的 读者 来 信 抱 她 说 书 中 没有 足够 多 和 足够 成 熟 的 
应 用 程序 。 也 有 人 说 代码 的 例子 不 够 长 或 者 不 够 完整 。 其 他 人 则 全 部 写 信 说 他 们 喜欢 书 中 简 
洁 易 懂 的 例子 ， 它 们 从 不 连篇 系 肯 、 乱 人 心智 。 我 们 偏爱 提供 简短 代码 背后 的 哲学 是 ， 让 读 
者 能 学 会 响 一 斑 而 知 全 豹 。 像 搭 积木 一 样 步 步 深入 ， 最 终 垒 土 成 山 ， 完 成 大 型 应 用 程序 。 书 
中 大 多 数 大 型 程序 都 有 乏 行 解释 。 丰 富 的 翻译 代码 注释 遍布 其 中 ， 你 可 以 在 学 习 Python 的 同 
时 加 以 实践 一 “ 尽 可 能 充分 地 使 用 交互 解释 器 。 通 过 这 个 方法 你 不 仅 可 以 学 习 和 提高 Python 
水 平 ， 同 时 还 能 在 向 源 文件 粘贴 代码 之 前 就 解决 bug。 


学 习 Python 不 能 光学 不 练 。 你 会 发 现 每 章 的 末尾 的 练习 是 本 书 的 重要 优势 。 它 们 可 以 检验 你 
对 该 章 主题 和 定义 的 理解 ， 还 能 尽 可 能 将 你 引 向 编码 。 开 发 应 用 程序 是 最 快 最 高 效 学 习 程序 
设计 语言 所 无 可 替代 的 方式 。 你 将 面 对 简 单 、 中 等 、 困 难 三 种 深度 的 问题 。 你 要 自己 编写 那 
些 读者 想 在 书 中 看 到 的 * 大 "应 用 程序 ， 而 不 是 由 我 代劳 ， 这 将 令 你 获 益 菲 浅 。 


关于 读者 


本 书 主要 面向 那些 没有 接触 过 Python 的 程序 员 和 那些 已 经 有 所 了 解 但 想 继续 学 习 和 提高 自身 
Python 技巧 的 程序 员 。Python 已 经 被 应 用 在 了 众多 领域 ， 包 括 工程 、 信 息 技术 、 科 学 、 商 
务 、 娱 乐 ， 等 等 。 这 些 领 域 涵 盖 了 ， 但 绝 不 局 限于 下 列 Python 用 户 (以 及 本 书 读者 ) 


e 软件 工程 师 ; 

o 硬件 设计 师 / 计 算 机 辅助 设计 工程 师 ; 
e 质量 评测 /测试 和 自动 控制 构架 开发 者 ; 
e 信息 服务 /信息 技术 /系统 和 网 络 管理 员 ; 
e 科学 家 和 数学 家 ; 

e 技术 或 项 目 管 理 人 员 ; 

e 多 媒体 或 音频 /视频 工程 师 ; 


e. 源 代 码 管理 和 发 布 工程 师 ; 


网 站 管理 员 和 内 容 管理 员 ; 


客户 /技术 支持 工程 师 ; 


数据 库 工 程 师 和 管理 员 ; 


e 研究 与 开发 工程 师 ; 


软件 集成 开发 和 专业 服务 人 士 ; 


e 大 学 和 高 中 教 职 人 员 ; 


网 络 服务 系统 工程 师 ; 


金融 软件 工程 师 ; 


e 诸多 其 他 行业 人 士 。 


一 些 知名 的 大 公司 都 在 使 用 着 Python， 例 如 : Google ` J% ` NASA ` Lucasfilm/Industrial 
Light and Magic ` Red Hat ^ Zope ` 33/6 ` Kopf & LJ o 


作者 的 Python 经 历 


我 是 十 多 年 前 在 一 家 名 为 Fourll 的 公司 里 初 涉 Python 的 。 那 时 ， 公 司 拥有 一 个 源头 产品 
Fourll.com 白 页 目录 服务 。Python 当 时 被 用 于 设计 我 们 的 下 一 个 产品 : Rocketmail 在 线 电 子 邮 
件 服务 系统 ， 也 就 是 今天 雅虎 邮件 系统 的 前 身 (和 白 页 是 指 用 户 信息 数据 库 ，Rocketmail 是 第 





一 个 主流 的 免费 邮件 系统 。 日 后 Fourll 被 雅虎 收购 ， 和 雅虎 使 用 Rocketmail 的 引擎 开发 了 和 雅虎 邮 
件 一 一 译 者 注 ) 。 





学 习 Python 和 加 入 最 早 的 雅虎 邮件 引擎 团队 都 是 令 人 愉悦 的 。 借 此 ， 我 重 构 了 地 址 簿 和 拼写 

检查 程序 。 那 时 ，Python 的 身影 也 逐渐 出 现在 了 其 他 的 雅虎 页 面 上 。 比 如 "网 上 寻 友 ”(People 
Search) 、“ 黄 页 ”、“ 地 图 和 出 行路 线 ”( Maps and Driving Directions) 等 ， 我 还 曾 担任 过 "网 
上 寻 友 ?的 主管 工程 师 。 


虽然 当时 Python 对 我 来 说 是 全 新 的 ， 但 是 它 却 很 容易 上 手 一 一 比 我 之 前 学 过 的 语言 都 简单 多 
了 “。 由 于 当时 Python 教程 的 荐 乏 ， 所 以 我 不 得 不 使 用 《Python 库 参 考 手册 》 和 《快速 参考 指 
南 》 作 为 我 的 学 习 工 具 ， 这 也 触发 了 我 写作 你 手中 这 本 书 的 念头 。 


我 还 在 雅虎 的 日 子 里 ， 就 可 以 利用 Python 找到 有 趣 的 途径 来 完成 五 花 八 门 的 工作 了 。 每 次 ， 
Python 的 力量 都 能 让 我 眼前 一 亮 、 信 和 手 牛 来 地 化 解 问题 。 我 同时 还 开发 了 一 些 Python 课 程 ， 
并 将 本 书 的 内 容 用 于 授课 ， 所 以 这 引 算 得 上 是 完全 原创 。 


本 书 不 仅 是 一 本 出 众 的 学 习 用 书 ， 同 样 也 是 一 部 绝 佳 的 Python 教学 用 书 。 身 为 一 位 工程 师 ， 
我 知道 如 何 学 习 、 掌 握 、 应 用 一 门 新 技术 。 作 为 一 名 职业 讲师 ， 我 也 知道 如 何 向 顾客 提供 最 
高 效 的 训练 。 正 因为 有 了 这 些 经 验 ， 才 能 给 你 带 来 丨 实情 况 的 模拟 和 提示 ， 这 是 你 无 法 从 那 
些 仅 仅 是 “训练 师 ? 或 "书籍 作者 "的 人 那里 获得 的 。 


关于 作者 的 写作 风格 : 技术 性 强 ， 但 通俗 易 懂 


与 一 本 严格 意义 上 的 "入门 ?读物 或 纯粹 的 计算 机 核心 技术 参考 书籍 不 同 的 是 ， 我 的 教学 经 验 告 
诉 我 ， 一 本 易于 阅读 并 且 还 能 坚持 技术 导向 的 书 才 是 最 符合 读者 需求 的 。 也 只 有 这 样 的 书 才 
能 让 你 尽 可 能 以 最 快 的 速度 提高 Python， 并 能 将 其 应 用 于 你 的 任务 中 。 我 们 引入 概念 ， 并 配 
以 相应 的 实例 来 加 快 学 习 进 程 。 在 每 章 的 最 后 提供 了 许多 练习 ， 借 此 你 可 以 巩固 学 到 的 概念 
并 验证 阅读 中 产生 的 想法 。 


能 与 Bruce Eckel 的 写作 风格 相提并论 ， 让 我 们 既 感到 荣幸 ， 又 觉得 过 誉 了 。 这 可 不 是 一 本 村 
燥 的 大 学 教材 ， 作 为 作者 ， 我 是 在 和 你 交流 ， 把 你 当 作 是 我 广 受 好 评 的 Python 培训 班 中 的 一 
员 。 作 为 一 个 终身 学 习 者 ， 我 经 常 将 自己 置身 于 学 生 中 ， 告 诉 你 如 何 才 能 让 你 尽 可 能 快速 透 
彻 地 掌握 概念 。 你 将 能 够 快速 通畅 的 阅读 本 书 ， 而 不 必 去 在 意 那 些 技 术 资 料 。 


身 为 一 名 工程 师 ， 我 知道 为 了 让 你 掌握 Python 的 概念 需要 传授 什么 。 作 为 一 个 老师 ， 我 知道 
如 何 将 技术 细节 凝 炼 成 能 让 你 轻松 理解 并 能 立刻 上 手 的 语言 。 本 书 充分 地 展现 了 我 的 写作 风 
格 和 教学 风格 ， 但 使 用 Python 编 程 更 是 一 种 享受 。 


关于 第 二 版 


在 本 书 第 一 版 出 版 之 后 ， 随 着 2. 0 版 的 发 布 ，Python 进 入 了 自己 的 第 二 个 时 代 。 自 那 之 后 ， 这 
门 语 言 的 重大 进步 为 其 带 来 了 全 面 而 持续 的 成 功 和 认可 。 握 除了 缺陷 ， 加 入 了 新 特点 ， 这 为 
全 球 的 Python 开发 者 带 来 了 新 一 级 别 的 能 力 和 挑战 。 我 真 的 很 担心 ， 这 本 续 作 能 否 在 涵盖 所 
有 激动 人 心 的 新 特点 的 同时 还 保持 原来 简单 易 懂 的 特点 。 本 书 涵盖 了 2006 年 秋 发 布 的 Python 
2. 5 版 本 ， 乃 至 一 些 关 于 将 来 2. 6 版 的 预告 。 如 同 第 一 版 一 样 ， 我 们 的 目标 是 让 本 书 所 有 主题 
不 受 版 本 的 影响 ， 让 读者 能 终身 受用 ， 而 不 是 很 快 被 淘汰 。 


Python 的 创始 人 Guido van Rossum 一 直 慢 慢 酝 酿 着 Python 的 下 一 次 大 转变 ， 他 亲切 地 称 之 
A) "Python3000" » "Python 3000" 和 它 的 缩写 "Py3k" 都 只 是 Python 3. 0 的 代号 。 它 会 和 2. x 版 本 
平行 开发 。 尽 管 会 产生 一 些 和 过 去 Python 版 本 的 不 兼容 ， 但 是 核心 团队 会 尽 全 力 确保 绝 大 部 
分 的 向 下 兼容 性 (这 也 是 Python 新 版 本 研发 的 惯例 ) 。 我 们 更 加 期 盼 能 在 握 除 原 有 设计 缺陷 
和 争议 的 同时 ， 添 加 更 多 有 趣 的 特性 。 


在 本 版 中 加 入 的 新 主题 包括 : 
。 布尔 型 和 集合 类 型 (第 5 章 和 第 7 章 ) 
。 新 式 类 (第 13 章 ) 

。 子 类 、 内 建 类 
o dd eR 


o 元 类 
e X (第 11 章 ) 

o 生成 器 

o 函数 (与 方法 ) 装饰 器 

o 静态 诅 套 作用 域 

o 内 部 函数 

o 闭 包 

o Currying 和 偏 函数 应 用 
e 循环 结构 (第 8 章 ) 

o 迭代 器 


o 列表 解析 


e 扩展 导入 语法 (第 12 章 ) 


o as 关键 字 


o 相对 导入 

e 改良 的 异常 处 理 功能 (第 10 章 ) 
o witht 4] 
o try-except-finally?& 47 


此 外 ， 我 们 很 高 兴 在 本 书 中 加 入 3 章 新 内 容 : 第 17 章 、 第 21 章 和 第 23 章 。 这 3 章 里 面 有 很 多 中 
级 的 内 容 会 经 常用 到 。 所 有 原来 的 章节 都 已 经 更 新 到 Python 的 最 新 版 本 。 


章节 导航 


本 书 分 为 两 大 部 分 : 第 一 部 分 ， 占 据 了 大 约 三 分 之 二 的 篇 幅 ， 来 向 你 阐释 这 门 语言 的 "核心 "内 
容 。 第 二 部 分 则 提供 了 各 种 高 级 主题 来 向 你 展示 你 可 以 使 用 Python 来 做 些 什么 。 


Python 无 处 不 在 有 了 时 发 现 正在 使 用 Python 的 人 ， 以 及 他 们 正在 用 Python 解 决 的 工作 是 令 
人 惊异 的 一 尽管 我 们 很 高 兴 在 本 书 中 加 入 了 许多 主题 ， 比 如 Java/Jython、Win32 编 程 、 使 
用 HTMLgen 处 理 CGI、 使 用 第 三 方 工具 (wxWidgets、GTK+、Qt 等 ) 的 GUI 编程 、XML 处 
理 、 数 字 科 学 计算 处 理 、 视 觉 和 图 形 图 像 处 理 、Web 服 务 和 应 用 程序 框架 (Zope、Plone、 
Django、TurboGears 等 ) ， 但 是 没有 足够 的 时 间 将 这 些 主题 完善 成 独立 的 章节 。 不 管 怎样 ， 
我 们 很 高 兴 至 少 针对 这 些 Python 发 展 的 关键 领域 已 经 完成 了 很 不 错 的 介绍 。 这 当然 就 包括 前 
面 提 到 的 那些 主题 。 





第 1 部 分 : Python 核心 

第 1 章 一 “欢迎 来 到 Python 世界 

在 开始 的 地 方 我 们 会 介绍 Python 的 历史 、 特 性 和 优点 等 ， 当 然 还 有 如 何 获得 和 安装 Python 。 
第 2 章 一 一 快速 入 门 


如 果 你 是 一 个 有 经 验 的 程序 员 ， 只 想 看 看 Python 如 何 工 作 的 ， 这 一 章 就 是 你 想 要 去 的 地 方 。 
在 这 里 我 们 会 介绍 Python 中 基本 的 概念 和 语句 ， 其 中 很 多 内 容 对 你 来 说 也 许 会 很 熟悉 ， 你 可 
以 只 学 习 Python 中 正确 的 语法 ， 然 后 直接 开始 你 的 项 目 了 。 


第 3 章 一 Python 基础 

本 章 将 对 Python 的 语法 进行 总 览 ， 并 给 出 一 些 关 于 风格 的 注意 事项 。 你 可 以 接触 到 Python 的 
关键 词 ， 还 会 了 解 它 的 内 存 管理 能 力 。 在 本 章 的 结尾 将 会 出 现 你 的 第 一 个 Python 程序 ， 你 可 
VAR E] X XE Og Python iR o 

第 4 章 一 Python *t $- 

本 章 主 要 介绍 Python 中 的 对 象 。 除 了 一 般 对 象 的 属性 外 ， 我 们 还 会 展示 Python 的 数据 类 型 和 
操作 符 ， 以 及 多 种 对 标准 类 型 的 分 类 方法 。 本 章 还 会 涉及 一 部 分 内 建 函 数 ， 它 们 对 绝 大 多 数 
Python 对 象 都 有 效 。 

第 5 章 一 一 数字 

在 这 一 章 ， 我 们 会 讨论 Python 主要 的 数字 类 型 : 整 型 、 浮 点 型 和 复数 。 我 们 会 研究 对 所 有 数 
字 有 效 的 操作 符 、 内 建 函 数 以 及 工厂 函数 ， 还 会 简短 地 看 一 下 其 他 相关 的 类 型 。 

第 6 章 一 一 序列 : 字符 串 、 列 表 和 元 组 

这 一 章 是 你 遇 到 的 第 一 个 内 容 丰富 的 章节 ， 它 将 向 你 展示 Python 中 所 有 的 序列 类 型 : 字符 
串 、 列 表 和 元 组 、 它 们 功能 很 强大 。 我 们 还 会 向 你 展示 和 每 个 类 型 有 关 的 内 建 函 数 、 方 法 及 
寺 性 ， 当 然 还 有 所 有 的 操作 符 。 


E 


第 7 章 一 一 映射 和 集合 类 型 

字典 是 Python 中 的 集合 类 型 ， 又 称 散 列 类 型 。 和 其 他 数据 类 型 一 样 ， 字 典 也 有 操作 符 、 内 建 
函数 和 方法 。 本 章 还 会 讲述 集合 类 型 ， 同 样 会 讨论 它们 的 操作 符 、 内 建 函 数 、 工 厂 函 数 和 内 
建 方法 。 


第 8 章 条 件 和 循环 





和 许多 其 他 高 级 编程 语言 一 样 ，Python 支 持 诸 如 for 和 while 之 类 的 循环 ， 以 及 if 语 名 (及 相关 
AR) 。Python 还 有 一 个 内 建 函 数 range()， 它 可 以 使 Python 的 for 循 环 表现 得 像 一 个 传统 的 计 
数 循 环 ， 而 不 是 像 一 个 oreach" 选 代 循 环 。 本 章 还 涵盖 了 一 些 辅助 语句 ， 例 如 break、 
continue 和 pass。 还 有 一 部 分 内 容 是 关于 新 的 结构 ， 例 如 迭代 器 、 列 表 解 析 和 生成 器 表达 式 。 
第 9 章 一 一 文件 和 输入 输出 

除了 标准 文件 对 象 和 输入 /输出 ， 本 章 还 介绍 了 文件 系统 存 取 、 文 件 执行 和 永久 存储 。 


第 10 章 萌 误 和 异常 





Python 的 最 强大 的 结构 之 一 就 是 它 的 异常 处 理 能 力 。 在 本 章 ， 你 可 以 看 到 完全 的 处 理 过 程 ， 
还 有 一 些 用 来 告诉 我 们 如 何 引发 或 者 抛 出 异常 的 指示 。 还 有 一 点 更 重要 的 内 容 是 如 何 创 造 我 
们 自己 的 异常 类 。 


4$ 113: — — E Ue h CARE 


编写 和 调用 函数 相对 而 言 还 是 比较 直观 的 ， 但 是 Python 还 有 许多 特性 会 让 你 觉得 有 用 ， 比 如 
默认 参数 ，" 命 名 ?参数 或 者 说 关键 词 参数 、 可 变 长 度 参 数 和 函数 式 编程 结 构 。 我 们 还 将 粗略 看 
一 下 变量 范围 和 递归 ， 另 外 还 要 讨论 一 些 高 级 特性 ， 比 如 生成 器 、 装 饰 器 、 内 部 函数 、 闭 

包 、 偏 函数 程序 (currying 的 更 普遍 形式 ) 。 


第 12 章 一 一 模块 


Python 的 一 个 关键 能 力 就 是 它 的 可 扩充 性 。 这 种 特性 允许 * 即 插 即 用 ”访问 ， 还 鼓励 了 代码 复 
用 。 写 成 模块 的 程序 可 以 被 其 他 程序 导入 ， 过 程 简单 到 只 要 一 行 代码 。 此 外 ， 多 模块 的 软件 
分 发 可 以 通过 使 用 包 (package) 来 简化 。 


第 13 章 一 一 面向 对 象 编程 


Python 是 个 完全 的 面向 对 象 (OO) 编程 语言 ， 而 且 从 一 开始 就 是 这 样 设计 的 。 当 然 ，Python 
不 强迫 你 用 这 种 方式 编程 ， 你 可 以 继续 开发 结构 式 、 过 程式 的 代码 。 任 何 时 间 当 你 准备 好 利 

用 OO 编程 的 优势 时 ， 你 可 以 转换 到 OO 编程 上 。 同 样 地 ， 本 章 是 为 了 指导 你 完全 理解 这 些 概 

念 ， 还 讨论 了 一 些 高 级 主题 ， 例 如 操作 符 重 载 、 定 制 和 按 权 。 本 章 还 介绍 了 一 些 关 于 新 式 类 

的 新 特性 ， 例 如 slot、 属 性 (property) 、 描 述 符 (descriptor) 和 元 类 (metaclass) 。 


第 14 章 一 一 执行 环境 

“执行 "这 个 词 可 以 有 很 多 不 同 的 意义 ， 从 可 调用 和 可 执行 的 对 象 到 执行 其 他 程序 (Python 或 者 
其 他 的 ) 。 本 章 会 讨论 这 些 主题 ， 以 及 通过 操作 系统 接口 来 控制 执行 ， 另 外 还 提出 几 种 不 同 
的 终止 执行 的 方法 。 

第 2 部 分 : 高 级 主题 

第 15 章 一 一 正则 表达 式 


正则 表达 式 是 个 非常 强大 的 工具 ， 可 以 用 来 进行 模式 匹配 、 提 取 和 搜索 -替换 。 本 章 可 以 学 习 
到 这 些 内 容 。 





第 16 章 网 络 编程 


如 今 有 太 多 的 程序 是 面向 网 络 的 。 你 该 从 何 下 手 呢 ?可 以 从 本 章 学 习 到 如 何 使 用 TCP/IP 和 
UDP/IP 来 创建 客户 端 和 服务 器 端 ， 另外 还 可 以 初步 了 解 SocketServer 和 Twisted ° 


第 17 章 网 络 客户 端 编程 





在 第 16 章 中 ， 我 们 介绍 了 如 何 使 用 套 接 字 来 进行 网 络 编程 。 今 天 我 们 使 用 的 绝 大 部 分 网 络 协 
议 都 是 使 用 套 接 字 开 发 的 。 在 这 一 章 ， 我 们 将 探索 更 高 一 层 的 库 ， 它 们 被 用 来 创建 上 述 网 络 
协议 的 客户 端 。 特 别 地 ， 我 们 会 关注 FTP、NNTP、SMTP 和 POP3 客 户 端 。 


第 18 章 一 一 多 线程 编程 


多 线程 编程 可 以 用 来 提高 很 多 类 型 的 程序 的 执行 性 能 。 很 多 人 想 要 一 些 关于 Python 中 多 线程 
编程 的 文档 ， beo 些 呼声 停止 了 ， 因 为 这 里 会 解释 概念 ， 并 向 你 展示 如 何 正 确 的 建 
造 一 个 Python 多 线程 程序 。 


第 19 章 一 一 图 形 用 户 界 面 编程 


Tkinter 是 Python 上 的 默认 图 形 用 户 界 面 (GUI). 开发 模块 ， 它 是 基于 Tk 图 形 工具 集 的 。 我 们 
将 向 你 展示 如 何 打造 一 个 简单 的 GUI 程 序 例子 (我 至 少 要 说 10 遍 : 中 的 非常 快 ! ) 。 最 好 的 一 
种 学 习 方 法 是 复制 ， 通 过 修改 已 有 的 这 几 个 程序 例子 ， 你 已 经 开始 了 你 的 GUI 之 旅 。 我 们 以 一 
个 较 复 杂 的 例子 结束 本 章 ， 当 然 还 顺便 介绍 了 Tix、Pmw、wxPython 和 PyGTK。 


$203: — Web 编程 


我 们 使 用 Python 编程 一 共有 三 个 主要 形式 ， 即 Web 客 户 端 、Web 服 务 器 和 广 受 欢迎 的 通 

i c uu  u-u c 
AÈ: 简单 /高 级 的 Web 窜 户 端 和 CGI 程序 ， 以 及 如 何 建立 你 自己 的 Web 服 务 器 。 

第 21 章 一 一 数据 库 编程 

对 Python 来 说 ， 数 据 库 编程 和 其 他 类 型 的 编程 一 样 ， 都 很 简单 、 有 趣 。 我 们 首先 回顾 一 下 基 
本 的 概念 ， 然 后 介绍 Python 数据 库 的 程序 接口 (API) 。 接 着 我 们 将 向 你 展示 如 何 才能 连接 

到 一 个 关系 数据 库 ， 如 何 使 用 Python 进行 查询 和 其 他 操作 。 最 后 ， 如 果 你 不 想 碰 SQL， 不 想 
考虑 底层 的 数据 库 而 只 想 使 用 对 象 ， 我 们 将 向 你 介绍 一 些 对 象 -关系 管理 器 (ORM) ， 它 们 可 
以 再 次 简化 数据 库 编程 。 

第 22 章 一 一 扩展 Python 


我 们 以 前 提 到 过 代码 复 用 和 语言 扩展 的 强大 性 。 在 纯 Python 中 ， 这 些 扩展 是 以 模块 形式 存在 
的 ， 但 是 你 也 可 以 使 用 C、C++ 或 者 Java 来 开发 底层 代码 ， 并 提供 无 颖 的 Python 接 口 。 使 用 低 
级 别 的 编程 语言 编写 你 的 扩展 可 以 让 你 提高 性 能 和 安全 性 ， 因 为 源 代码 不 需要 公开 。 本 章 将 
一 步 一 步 介 绍 扩展 的 打造 过 程 。 


第 23 章 一 一 其 他 话题 


本 章 包 含 了 一 些 额 外 材料 ， 我 们 会 在 下 一 版 将 它们 扩展 成 全 面 、 单 独 的 章节 。 本 章 的 主题 包 
括 Web 服 务 、 微 软 Office (Win32 COM 客 户 端 ) 编程 和 Java/Jython。 


` ^ ATL 
选读 段落 


书 中 某 些 标 有 星 号 (*) 的 段落 和 练习 ， 表 示 其 为 晋级 或 者 可 选读 的 。 它 们 通常 是 自 成 一 体 
的 ， 你 可 以 在 今后 有 时 间 的 时 候 再 研究 。 


如 果 你 已 经 有 了 足够 的 编程 知识 ， 并 且 已 经 设置 好 了 Python 开发 环境 。 那 么 你 就 可 以 跳 过 第 1 
直接 进入 第 2 章 了 。 从 那里 你 可 以 理解 Python 并 开始 实际 应 用 。 


体例 


“核心 笔记 "图 标 
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“核心 风格 "图 标 





“核心 模块 "图 标 
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Python 的 新 功能 以 这 个 图 标 标注 。 图 标 中 数字 是 指 该 功能 首次 出 现时 的 版 本 号 。 


本 书 资 源 


你 可 以 在 本 书 的 网 站 (http://corepython.com) 上 找到 : 勘误 表 、 更 新 、 研 讨 预告 ~、 Python] 
练 、 下 载 和 其 他 相关 信息 。 
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Python 核心 


第 1 章 ”欢迎 来 到 Python 世界 


本 章 主题 

e 什么 是 Python 
+ Python 的 起 源 
+ Python 的 特点 


+ 下 载 Python 


+ Python 文档 
+ 比较 Python (与 其 他 语言 的 比较 ) 
4 其 他 实现 


开篇 将 介绍 一 些 Python 的 背景 知识 ， 包 括 什么 是 Python、Python 的 起 源 和 它 的 一 些 关键 特 
性 。 一 旦 你 来 了 兴致 ， 我 们 就 会 向 你 介绍 怎样 获得 Python， 以 及 如 何在 你 的 系统 上 安装 并 运 
行 它 。 本 章 最 后 的 练习 将 会 帮助 你 非常 自如 地 使 用 Python， 包 括 使 用 交互 式 解 释 器 ， 以 及 创 
建 并 运行 脚本 程序 。 


1.1 什么 是 Python 


Python 是 一 门 优 雅 而 健壮 的 编程 语言 ， 它 继承 了 传统 编译 语言 的 强大 性 和 通用 性 ， 同 时 也 借 
鉴 了 简单 脚本 和 解释 语言 的 苏 用 性 。 它 可 以 帮 你 完成 工作 ， 而 且 一 段 时间 以 后 ， 你 还 能 看 明 
白 自 己 写 的 这 段 代码 。 你 会 对 自己 如 此 快 地 学 会 它 和 它 强 大 的 功能 感到 十 分 的 惊讶 ， 更 不 用 
提 你 已 经 完成 的 工作 了 ! 只 有 你 想不到 ， 没 有 Python 做 不 到 。 


1.2 起 源 


Guido van Rossum 于 1989 年 底 始 创 了 Python， 那 时 ， 他 还 在 荷兰 的 CWI (Centrum voor 
Wiskunde en Informatica， 国 家 数学 和 计算 机 科学 研究 院 ) 。1991 年 初 ，Python 发 布 了 第 一 
个 公开 发 行 版 。 这 一 切 究竟 是 如 何 开始 的 呢 ? 像 C、C++、Lisp、Java 和 Perl 一 样 ，Python 来 
自 于 某 个 研究 项 目 ， 项 目 中 的 那些 程序 员 利 用 手边 现 有 的 工具 辛苦 地 工作 着 ， 他 们 设想 并 开 
发 出 了 更 好 的 解决 办 法 。 


那 时 van Rossum 是 一 位 研究 人 员 ， 对 解释 型 语言 ABC 有 着 丰富 的 设计 经 验 ， 这 个 语言 同样 也 
是 在 CWI 开 发 的 。 但 是 他 不 满足 其 有 限 的 开发 能 力 。 已 经 使 用 并 参与 开发 了 像 ABC 这 样 的 高 
级 语言 后 ， 再 退回 到 C 语 言 显 然 是 不 可 能 的 。 他 所 期 望 的 工具 有 一 些 是 用 于 完成 日 常 系统 管理 
任务 的 ， 而 且 它 还 希望 能 够 访问 Amoeba 分 布 式 操作 系统 的 系统 调用 。 尽 管 van Rossum 也 曾 
想 过 为 Amoeba 开 发 专用 语言 ， 但 是 创造 一 种 通用 的 程序 设计 语言 显然 更 加 明智 ， 于 是 在 
1989 年 末 ，Python 的 种 子 被 播 下 了 。 


1 A 特 点 


尽管 Python 已 经 流行 了 超过 15 年 ， 但 是 一 些 人 仍旧 认为 相对 于 通用 软件 开发 产业 而 言 ， 它 还 
是 个 新 丁 。 我 们 应 当 谨 懂 地 使 用 "相对 ”这 个 词 ， 因 为 "网 络 时 代 ” 的 程序 开发 ， 几 年 看 上 去 就 像 
几 十 年 。 

当 人 们 询问 : “什么 是 Python?” 的 时 候 ， 很 难 用 任何 一 个 具象 来 描述 它 。 人 们 更 倾向 于 一 口气 


不 加 思索 地 说 出 他 们 对 Python 的 所 有 感觉 ，Python 是 (请 填写 ) ， 这 些 特 点 究竟 又 是 什 
么 呢 ? 为 了 让 你 能 知 其 所 以 然 ， 我 们 下 面 会 对 这 些 特点 进行 逐一 地 冰 释 。 





1.3.1 高 级 


伴随 着 每 一 代 编 程 语言 的 产生 ， 我 们 会 达到 一 个 新 的 高 度 。 汇 编 语言 是 献 给 那些 挣扎 在 机 器 
代码 中 的 人 的 礼物 ， 后 来 有 了 FORTRAN、C 和 Pascal 语 言 ， 它 们 将 计算 提升 到 了 新 新 的 高 
度 ， 并 且 开 创 了 软件 开发 行业 。 伴 随 着 C 语 言 诞生 了 更 多 的 像 C++、Java 这 样 的 现代 编译 语 
言 。 我 们 没有 止步 于 此 ， 于 是 有 了 强大 的 、 可 以 进行 系统 调用 的 解释 型 脚本 语言 ， 例 如 Tcl、 
Perl 和 Python。 


这 些 语言 都 有 高 级 的 数据 结构 ， 这 样 就 减少 了 以 前 "框架 "开发 需要 的 时 间 。 像 Python 中 的 列表 
(大 小 可 变 的 数组 ) 和 字典 (ARR) 就 是 内 建 于 语言 本 身 的 。 在 核心 语言 中 提供 这 些 重要 
的 构建 单元 ， 可 以 鼓励 人 们 使 用 它们 ， 缩 短 开发 时 间 与 代码 量 ， 产 生出 可 读 性 更 好 的 代码 。 


在 C 语 言 中 ， 对 于 混杂 数组 (Python 中 的 列表 ) 和 哈 希 表 (Python 中 的 字典 ) 还 没有 相应 的 
标准 库 ， 所 以 它们 经 常 被 重复 实现 ， 并 被 复制 到 每 个 新 项 目 中 去 。 这 个 过 程 混乱 而 且 容 易 产 
生 错误 。C++ 使 用 标准 模板 库 改进 了 这 种 情况 ， 但 是 标准 模板 库 是 很 难 与 Python 内 建 的 列表 
和 字典 的 简洁 和 易 读 相提并论 的 。 


1.3.2 du X 
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编程 支持 将 特定 的 行为 、 特 性 以 及 和 /或 功能 与 它们 要 处 理 或 所 代表 的 数据 结合 在 一 起 。 
Python 的 面向 对 象 的 特性 是 与 生 俱 来 的 。 然 而 ，Python 绝 不 像 Java 或 Ruby 仅 仅 是 一 门面 向 对 
象 语言 ， 事 实 上 它 融 汇 了 多 种 编程 风格 。 例 如 ， 它 甚至 借鉴 了 一 些 像 Lisp 和 Haskell 这 样 的 有 函 
数 语言 的 特性 。 


1.3.3 ”可 升级 


大 家 常常 将 Python 与 批 处 理 或 Unix 系 统 下 的 shell 相 提 并 论 。 简 单 的 shell 脚 本 可 以 用 来 处 理 简 
单 的 任务 ， 就 算 它 们 可 以 在 长 度 上 (无 限度 的 ) 增长 ， 但 是 功能 总 会 有 所 穷尽 。shell 脚 本 的 
代码 重用 度 很 低 ， 因 此 ， 你 只 能 止步 于 小 项 目 。 实 际 上 ， 即 使 一 些小 项 目 也 可 能 导致 脚本 又 
臭 又 长 。Python 却 不 是 这 样 ， 你 可 以 不 断 地 在 各 个 项 目 中 完善 你 的 代码 ， 添 加 额外 的 新 的 或 
者 现存 的 Python 元 素 ， 也 可 以 随时 重用 代码 。Python 提 倡 简洁 的 代码 设计 、 高 级 的 数据 结构 
和 模块 化 的 组 件 ， 这 些 特 点 可 以 让 你 在 提升 项 目的 范围 和 规模 的 同时 ， 确 保 灵活 性 、 一 致 性 
并 缩短 必要 的 调试 时 间 。 


“可 升级 "这 个 术语 最 经 常用 于 衡量 硬件 的 负载 ， 通 常 指 为 系统 添加 了 新 的 硬件 后 带 来 的 性 能 提 
升 。 我 们 乐于 在 这 里 对 这 个 引述 概念 加 以 区 分 ， 我 们 试图 用 “可 升级 "来 传达 一 种 观念 ， 这 就 
是 : Python 提供 了 基本 的 开发 模块 ， 你 可 以 在 它 上 面 开 发 你 的 软件 ， 而 且 当 这 些 需要 扩展 和 
增长 时 ，Python 的 可 插入 性 和 模块 化 架构 则 能 使 你 的 项 目 生 机 费 然 和 多 于 管理 。 


13.4 可 扩展 


就 算 你 的 项 目 中 有 大 量 的 Python 代 码 ， 你 也 依 昌 可 以 有 条 不 订 地 通过 将 其 分 离 为 多 个 文件 或 
模块 加 以 组 织 管 理 。 而 且 你 可 以 从 一 个 模块 中 选取 代码 ， 而 从 另 一 个 模块 中 读 取 属性 。 更 棒 
的 是 ， 对 于 所 有 模块 ，Python 的 访问 语法 都 是 相同 的 。 不 管 这 个 模块 是 Python 标准 库 中 的 还 
是 你 一 分 钟 之 前 创造 的 ， 哪 怕 是 你 用 其 他 语言 写 的 扩展 都 没 问 题 ! 借助 这 些 特 点 ， 你 会 感觉 
自己 根据 需要 "扩展 "了 这 门 语 言 ， 而 且 你 已 经 这 么 做 了 。 


代码 中 的 瓶颈 ， 可 能 是 在 性 能 分 析 中 总 排 在 前 面 的 那些 热门 或 者 一 些 特别 强调 性 能 的 地 方 ， 
可 以 作为 Python 扩展 用 C 重 写 。 需 要 重申 的 是 ， 这 些 接 口 和 纯 Python 模 块 的 接口 是 一 模 一 样 
的 ， 乃 至 代码 和 对 象 的 访问 方法 也 是 如 出 一 略 的 。 唯 一 不 同 的 是 ， 这 些 代 码 为 性 能 带 来 了 显 
著 的 提升 。 自 然 ， 这 全 部 取决 你 的 应 用 程序 以 及 它 对 资源 的 需求 情况 。 很 多 时 候 ， 使 用 编译 
型 代码 重 写 程序 的 瓶颈 部 分 绝对 是 益处 多 多 的 ， 因 为 它 能 明显 提升 整体 性 能 。 


程序 设计 语言 中 的 这 种 可 扩展 性 使 得 工程 师 能 够 灵活 附加 或 定制 工具 ， 缩 短 开发 周期 。 虽 然 
像 C、C++ 乃 至 Java 等 主流 第 三 代 语言 (3GL) 都 拥有 该 特性 ， 但 是 这 么 容易 地 使 用 C 编 写 扩 
展 确实 是 Python 的 优势 。 此 外 ， 还 有 像 PyRex 这 样 的 工具 ， 允 许 C 和 Python 混合 编程 ， 使 编写 
扩展 更 加 轻而易举 ， 因 为 它 会 把 所 有 的 代码 都 转换 成 C 语 言 代 码 。 


因为 Python 的 标准 实现 是 使 用 C 语 言 完 成 的 《也 就 是 CPython ) ， 所 以 要 使 用 C 和 C++ 编写 
Python 扩展 。Python 的 Java 实 现 被 称 作 Jython， 要 使 用 Java 编 写 其 扩展 。 最 后 ， 还 有 
IronPython， 这 是 针对 。NET 或 Mono 平 台 的 C# 实 现 。 你 可 以 使 用 C# 或 者 VB.Net 扩 展 
IronPython ° 


1.8.5 ”可 移植 性 


在 各 种 不 同 的 系统 上 可 以 看 到 Python 的 身影 ， 这 是 由 于 在 今天 的 计算 机 领域 ，Python 取 得 了 
持续 快速 的 成 长 。 因 为 Python 是 用 C 写 的 ， 又 由 于 C 的 可 移植 性 ， 使 得 Python 可 以 运行 在 任何 
带 有 ANSI C 编 译 器 的 平台 上 。 尽 管 有 一 些 针对 不 同 平台 开发 的 特有 模块 ， 但 是 在 任何 一 个 平 
台 上 用 Python 开 发 的 通用 软件 都 可 以 稍 事 修改 或 者 原封 不 动 地 在 其 他 平台 上 运行 。 这 种 可 移 
植 性 既 适 用 于 不 同 的 架构 ， 也 适用 于 不 同 的 操作 系统 。 


1.3.6 2 € 


Python 关键 字 少 、 结 构 简单 、 语 法 清晰 。 这 样 就 使 得 学 习 者 可 以 在 更 短 的 时 间 内 轻松 上 手 。 

对 初学 者 而 言 ， 可 能 感觉 比较 新 鲜 的 东西 就 是 Python 的 面向 对 象 特点 了 。 那 些 还 未 能 全 部 精 

通 OOP (Object Oriented Programming ， 面 向 对 象 的 程序 设计 ) 的 人 对 径直 使 用 Python 还 是 
有 所 顾 辟 的 ， 但 是 OOP 并 非 必须 或 者 强制 的 。 入 门 也 是 很 简单 的 ， 你 可 以 先 稍 加 涉猎 ， 等 到 

有 所 准备 之 后 才 开 始 使 用 。 


1.3.7 £2 


它 没 有 其 他 语言 通常 用 来 访问 变量 、 定 义 代 码 块 和 进行 模 


ba 
式 匹配 的 命令 式 符号 。 通 常 这 些 符号 包括 : 美元 符号 (9) 、 分 号 (;) 、 波 浪 号 (一 ) 等 。 没 
ZAR 


R) fq c EAMUS > Python 764/ 2 Jr yu e Ty 86S ES IR RE ETE BS AX > fa) 
其 他 人 很 快 就 能 理解 你 写 的 代码 ， 反 之 亦 然 。 如 前 所 述 ， 一 门 语言 的 可 读 性 让 它 更 易于 学 

习 。 我 们 甚至 敢 冒 昧 的 声称 ， 即 使 对 那些 之 前 连 一 行 Python 代码 都 没 看 过 的 人 来 说 ， 那 些 代 
码 也 是 相当 容易 理解 的 。 


1.3.8 JP 


源 代码 维护 是 软件 开发 生命 周期 的 组 成 部 分 。 只 要 不 被 其 他 软件 取代 或 者 被 放弃 使 用 ， 你 的 
软件 通常 会 保持 继续 的 再 开发 。 这 通常 可 比 一 个 程序 员 在 一 家 公司 的 在 职 时 间 要 长 得 多 了 。 

Python 项 目的 成 功 很 大 程度 上 要 归功 于 其 源 代 码 的 易于 维护 ， 当 然 这 也 要 视 代 码 长 度 和 复杂 
度 而 定 。 然 而 ， 得 出 这 个 结论 并 不 难 ， 因 为 Python 本 身 就 是 易于 学 习 和 阅读 的 。Python 另 外 
一 个 激动 人 心 的 优势 就 是 ， 当 你 在 阅读 自己 六 个 月 之 前 写 的 脚本 程序 的 时 候 ， 不 会 把 自己 搞 
得 一 头 雾 水 ， 也 不 需要 借助 参考 手册 才能 读 懂 自己 的 软件 。 


1.3.9 ”健壮 性 


没有 什么 能 够 比 允许 程序 员 在 错误 发 生 的 时 候 根 据 出 错 条 件 提 供 处 理 机制 更 有 效 的 了 。 和 针对 

«ix ^ Python 提 供 了 “安全 合理 "的 退出 机 制 ， 让 程序 员 能 掌控 局 面 。 一 旦 你 的 Python 由 于 错 

误 崩 演 ， 解 释 程序 就 会 转 出 一 个 “堆栈 跟踪 ”， 那 里 面 有 可 用 到 的 全 部 信息 ， 包 括 你 程序 崩溃 的 
原因 ， 以 及 是 哪 段 代码 (文件 名 、 行 数 、 行 数 调用 等 ) 出 错 了 。 这 些 错误 被 称 为 异常 。 如 果 

在 运行 时 发 生 这 样 的 错误 ，Python 使 你 能 够 监控 这 些 错误 并 进行 处 理 。 


这 些 异 常 处 理 可 以 采取 相应 的 措施 ， 例 如 解决 问题 、 重 定向 程序 流 、 执 行 清除 或 维护 步骤 、 
正常 关闭 应 用 程序 ， 亦 或 干脆 忽略 掉 。 无 论 如 何 ， 这 都 可 以 有 效 地 缩减 开发 周期 中 的 调试 环 
节 。Python 的 健壮 性 对 软件 设计 师 和 用 户 而 言 都 是 大 有 助 益 的 。 一 旦 某 些 错误 处 理 不 当 ， 
Python 也 还 能 提供 一 些 信息 ， 作 为 某 个 错误 结果 而 产生 的 堆栈 追踪 不 仅 可 以 描述 错误 的 类 型 
和 位 置 ， 还 能 指出 代码 所 在 模块 。 


1.3.10 ”高 效 的 快速 原型 开发 工具 


我 们 之 前 已 经 提 到 了 Python 有 是 多 么 的 易学 易 读 。 但 是 ， 你 或 许 要 间 了 ，BASIC 也 是 如 此 啊 ， 
Python 有 什么 出 类 拔 革 的 呢 ? 与 那些 封闭 僵化 的 语言 不 同 ，Python 有 许多 面向 其 他 系统 的 接 
口 ， 它 的 功能 足够 强大 ， 本 身 也 足够 强壮 ， 所 以 完全 可 以 使 用 Python 开发 整个 系统 的 原型 。 
显然 ， 传 统 的 编译 型 语言 也 能 实现 同样 的 系统 建 模 ， 但 是 Python 工程 方面 的 简洁 性 让 我 们 可 
以 在 同样 的 时 间 内 游 丸 有 余地 完成 相同 的 工作 。 此 外 ， 大 家 已 经 为 Python 开发 了 为 数 众 多 的 
扩展 库 ， 所 以 无 论 你 打算 开发 什么 样 的 应 用 程序 ， 都 可 能 找到 先行 的 前 莫 。 你 所 要 做 的 全 部 
事情 ， 就 是 来 个 “ 即 插 即 用 ”( 当然 ， 也 要 自行 配置 一 番 ) ! 只 要 你 能 想 得 出 来 ，Python 模 块 和 
包 就 能 帮 你 实现 。Python 标 准 库 是 很 完备 的 ， 如 果 你 在 其 中 找 不 到 所 需 的 ， 那 么 第 三 方 模块 
或 包 就 会 为 你 完成 工作 提供 可 能 。 


1.3.11 内 存 管理 器 


C 或 者 C++ 最 大 的 弊病 在 于 内 存 管理 是 由 开发 者 负责 的 。 所 以 哪怕 是 对 于 一 个 很 少 访问 、 修 改 
和 管理 内 存 的 应 用 程序 ， 程 序 员 也 必须 在 执行 了 基本 任务 之 外 履行 这 些 职责 。 这 些 加 在 开发 
者 身上 的 没有 必要 的 负担 和 责任 常常 会 分 散 精 力 。 


在 Python 中 ， 由 于 内 存 管理 是 由 Python 解释 器 负责 的 ， 所 以 开发 人 员 就 可 以 从 内 存 事务 中 解 
放出 来 ， 全 神 贯 注 于 最 直接 的 目标 ， 仅 仅 致力 于 开发 计划 中 首要 的 应 用 程序 。 这 会 使 错误 更 
少 、 程 序 更 健壮 、 开 发 周期 更 短 。 


1.3.12 ”解释 性 和 (FPT) 编译 性 


Python 是 一 种 解释 型 语言 ， 这 意味 着 开发 过 程 中 没有 了 编译 这 个 环节 。 一 般 来 说 ， 由 于 不 是 
以 本 地 机 器 码 运行 ， 纯 粹 的 解释 型 语言 通常 比 编译 型 语言 运行 得 慢 。 然 而 ， 类 似 于 Javal 
Python 实际 上 是 字 节 编译 的 ， 其 结果 就 是 可 以 生成 一 种 近似 机 器 语言 的 中 间 形 式 。 这 不 仅 改 
善 了 Python 的 性 能 ， 还 同时 使 它 保 持 了 解释 型 语言 的 优点 。 


核心 笔记 : 文件 扩展 名 


Python 源 文件 通常 用 .py 扩展 名 。 当 源 文件 被 解释 器 加 载 或 者 显 式 地 进行 字 节 码 编译 的 时 候 会 
被 编译 成 字 节 码 。 由 于 调用 解释 器 的 方式 不 同 ， 源 文件 会 被 编译 成 带 有 .pyc 或 .pyo 扩 展 名 的 文 
件 ， 你 可 以 在 第 12 章 学 到 更 多 的 关于 扩展 名 的 知识 。 


1.4 下 载 和 安装 Python 


得 到 所 有 Python 相 关 软 件 最 直接 的 方法 就 是 去 访问 它 的 网 站 (http://python.org) 。 为 了 方便 
读者 ， 你 也 可 以 访问 本 书 的 网 站 (http://corepython.com) 并 点 击 左 侧 的 “Download 
om ad 罗列 了 当前 针对 大 多 数 平台 的 Python 版 本 ， 当 然 ， 这 还 是 主要 
集中 在 ”三 巨头 "身上 : Unix, Win32 和 MacOS X ° 


正如 我 们 在 前 面 1.3.5 小 节 中 提 到 的 ，Python 可 应 用 的 平台 非常 广泛 。 我 们 可 以 将 其 划分 成 如 
下 的 几 大 类 和 可 用 平台 : 


e 所 有 Unix 衍 生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 ) 
e Win32 家 族 (Windows NT 2000, XP 等 ) 
e 早期 平台 : MacOS 8/9, Windows 3.x, DOS, OS/2, AIX 


e 掌上 平台 (掌上 电脑 /移动 电话 ) : Nokia Series 60/SymbiaOS, Windows 
CE/Pocket PC, Sharp Zaurus/arm-linux, PalmOS 


e 游戏 控制 台 : Sony PS2, PSP, Nintendo GameCube 
e 实时 平台 : VxWorks, QNX 


e 其 他 实现 版 本 : Jython, IronPython, stackless 


e 其 他 
Python 大 部 分 的 最 近 版 本 都 只 是 针对 “三 巨头 "的 。 实 际 上 ， 最 新 的 Linux 和 MacOS X 版 本 都 已 
经 安装 好 了 Python 一 你 只 需 查 看 一 下 是 哪个 版 本 。 尽 管 其 UU Me e Xx 对 
应 版 本 ， 但 是 就 1.5 版 而 言 这 些 版 本 也 有 了 显著 的 改进 。 一 些 平台 有 其 对 应 二 进 制版 本 ， 可 以 


直接 安装 ， 另 外 一 些 则 需要 在 安装 前 手工 编译 。 


Unix 衍 生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 ) 


正如 前 文 所 述 ， 基 于 Unix 的 系统 可 能 已 经 安装 了 Python。 最 好 的 检查 方法 就 是 通过 命令 行 运 
行 Python， 查 看 它 是 否 在 搜索 路 径 中 而 且 运 行 正常 。 只 需 输 入 : 


myMac: ^-wesley$ python 
Python 2.4 (#4, Mar 19 2005, 03:25:10) 
[GCC 3.3 20030304 (Apple Computer, Inc. build 1671) ] on Darwin 


Type "help", "copyright", "credits" or "license" for more information. 


"yss 


Windows/DOS £ 7i 


首先 从 前 文 提 到 的 python.org 或 是 corepython.com 网 站 下 载 msi 文 件 (例如 ，python- 
2.5.msi) ， 之 后 执行 该 文件 安装 Python。 如 果 你 打算 开发 Win32 程 序 ， 例 如 使 用 COM 或 
MFC， 或 者 需要 Win32 库 ， 强 烈 建 议 下 载 并 安装 Python 的 Windows 扩 展 。 之 后 你 就 可 以 通过 
DOS 命 令 行 窗口 或 者 IDLE 和 Pythonwin 中 的 一 个 来 运行 Python 了 ，IDLE 是 Python 缺 省 的 IDE 

(Integrated Development Environment， 集 成 开发 环境 ) ， 而 Pythonwin 则 来 自 Windows 扩 
展 模块 。 


自己 动手 编译 Python 

对 绝 大 多 数 其 他 平台 ， 下 载 .tz 文 件 ， 解 压缩 这 些 文件 ， 然 后 执行 以 下 操作 以 编译 Python。 
1. /configure 

2. make 

3. make install 


Python 通常 被 安 国定 的 位 置 ， 所 以 你 很 容易 就 能 找到 。 如 今 ， 在 系统 上 安装 多 种 版 本 的 
Python 已 经 是 司空 见 惯 的 事情 了 。 虽 然 容易 找到 二 进 制 执行 文件 ， 你 还 是 要 设置 好 库 文件 的 


安装 位 置 o 


在 Unix 中 ， 可 执行 文件 通常 会 将 Python 安装 到 /usrlocalbin 子 目录 下 ， 而 库 文 件 则 通常 安 

在 /usr local/lib/python2.x 子 目录 下 ， 其 中 的 2.x 是 你 正在 使 用 的 版 本 号 。MacOS X 系 HEN , 
Python 则 安装 在 /sw/bin V4 X Hi dlusrllocalibinT 目录 下 。 而 库 文 件 则 在 /sw/llib、usrlocallib > 
以 及 /或 者 /Library/ Frameworks/ Python.framework/Versions 子 目录 下 。 


在 Windows 中 ， 黑 认 的 安装 地 址 是 C: \Python2x。 请 避免 将 其 安装 在 C: \Program Files B % 
下 。 是 的 ， iR ULIS 文件 夹 。 但 是 DOS 是 不 支持 “Program Files" 3x J£ 4j 
长 文件 名 的 ， 它 通常 会 被 用 “Progra~ 人 这 个 别名 代替 。 这 有 可 能 给 程序 运行 带 来 一 些 麻 烦 ， 所 
以 最 好 尽量 避免 。 i 以 ， 听 我 的 ， 将 Python 安装 在 C: \Python 目 录 下 ， 这 样 标准 库 文 件 就 会 被 
安装 在 C: \Python\Lib 目 录 下 。 


1.5 ”运行 Python 


有 三 种 不 同 的 办 法 来 启动 Python。 最 简单 的 方式 就 是 交互 式 的 局 PA ， 每 次 输入 一 行 
Python 代码 来 执行 。 另 外 一 种 启动 Python 的 方法 是 运行 Python 脚本 。 这 样 会 调用 相关 的 脚本 
解释 器 。 最 后 一 种 办 法 就 是 用 集成 开发 环境 中 的 图 形 用 户 界 面 运行 Python。 集 成 开发 环境 通 
常 整合 了 其 他 的 工具 ， 例 如 集成 的 调试 器 、 文 本 编辑 器 ， 而 且 支 持 各 种 像 CVS 这 样 的 源 代 码 
版 本 控制 工具 。 


1.5.1 命令 行 上 的 交互 式 解 释 器 


在 命令 行 上 启动 解释 器 ， 你 马上 就 可 以 开始 编写 Python 代码 。 在 Unix, DOS 或 其 他 提供 命令 行 
解释 器 或 shell 窗 口 的 系统 中 ， 都 可 以 这 么 做 。 学 习 Python 的 最 好 方法 就 是 在 交互 式 解释 器 中 
练习 。 在 你 需要 体验 Python 的 一 些 特 性 时 ， 交 互 式 解释 器 也 非常 有 用 。 


Unix 衍 生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 ) 


要 访问 Python， 除 非 你 已 经 将 Python 所 在 路 径 添加 到 系统 搜索 路 径 之 中 ， 否 则 就 必须 输入 
Python 的 完整 路 径 名 才 可 以 启动 Python。Python 一 般 安 装 在 /usrbin 或 /usrlocal/bin 子 目录 
中 。 


我 们 建议 读者 把 Python (python 执 行文 件 ， 或 Jython 执 行文 件 一 一 如 果 你 想 使 用 Java 版 的 解 
释 器 的 话 ) 添加 到 你 的 系统 搜索 路 径 之 中 ， 这 样 你 只 需要 输入 解释 器 的 名 字 就 可 以 启动 
Python 解释 器 了 ， 而 不 必 每 次 都 输入 完整 路 径 。 


要 将 Python 添加 到 搜索 路 径 中 ， 只 需要 检查 你 的 登录 启动 脚本 ， 找 到 以 set path 或 PATH= 指 令 
开始 ， 后 面 跟着 一 串 目录 的 那 行 ， 然 后 添加 解释 器 的 完整 路 径 。 所 有 事情 都 做 完 之 后 ， 更 新 
一 下 shell 路 径 变量 。 现 在 在 Unix 提 示 符 (根据 shell 的 不 同 可 能 是 % 或 $) 处 键入 python (或 
jython) 就 可 以 启动 解释 器 了 ， 如 下 所 示 。 


$ python 


Python 启 动 成 功 之 后 ， 你 会 看 到 解释 器 启动 信息 ， 表 明 Python 的 版 本 号 及 平台 信息 ， 最 后 显 
示 解 释 器 提示 符 ">>>"“ 等 待 你 输入 Python 命令 。 


Windoes/DOS 环 境 


为 了 把 Python 添加 到 搜索 路 径 中 ， 你 需要 编辑 Cautoexec.bat 文 件 并 将 完整 的 Python 安装 路 
径 添 加 其 中 。 这 通常 是 C:\Python 或 C:\Program Files\Python (或 是 “Program Files DOS TF 
的 简写 名 字 C:\Progra ~1\Python) ° 


要 想 在 DOS 中 将 Python 添 加 到 搜索 路 径 中 去 ， 需 要 编辑 C:\autoexec.bat 文 件 ， 把 Python 的 安 
装 目录 添加 上 去 。 一 般 是 C:\Python 或 C:\Program Files\Python (或 者 它 在 DOS 中 的 简写 名 字 
C:\Progra~1\Python) 。 在 一 个 DOS 窗 口中 ( 它 可 以 是 纯 DOS 环 境 或 是 在 Windows 中 的 启动 
的 一 个 DOS 窗 口 ) 启动 Python 的 命令 与 Unix 操 作 系 统 是 一 样 的 ， 都 是 “python”， 它 们 唯一 的 
区 别 在 于 提示 符 不 同 ，DOS 中 是 CA\>， 如 图 1-1 所 示 。 
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eoo Terminal — bash — ttyp3 — 80x25 一 €3 
myMac:- wescS i5 
myMac:~ wesc$ python r 


Python 2.4 (W4, Mar 19 2005, 03:25:10) 

[ccc 3.3 20030304 (Apple Computer, Inc. build 1671)] on darwin 

Type "help*, *copyright', "oredits” or 'license* for more information. 
>>> 

>>> print 'Mello World! 

Hello World! 

>>> 

>>> import sys | 
>>> sys.stdout.write('Mello World!Wn') | 
Hello World! 

>>> | 


myMac:~ weso$ 目 | 
| 


| 


$ T a) 


图 1-1 在 一 个 UNIX (MacOs X) 窗口 启动 Python 时 的 屏幕 画面 


C:\> python 


当 从 命令 行 启 动 Python 的 时 候 ， 可 以 给 解释 器 一 些 选项 。 这 里 有 部 分 选项 可 供 选 择 。 


—d 提供 调试 输出 。 

一 o 生成 优化 的 字 节 码 〈 生 成 .pyo 文件 )。 

一 s 不 导入 site 模块 以 在 启动 时 查找 Python 路 径 。 
一 v 元 余 输 出 (导入 语句 详细 追踪 )。 

—m mod 将 一 个 模块 以 脚本 形式 运行 。 

—Q opt 除法 选项 (参阅 文档 )。 

—c cmd 运行 以 命令 行 字符 串 形式 提交 的 Python 脚本 。 
file 从 给 定 的 文件 运行 Python 脚本 (参阅 后 文 )。 
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icro t ersion 
c» Cosor igit 1985- 2801 Ed uix "Corp. 


*NMINDOUS ss ysten32»python 
ython 2.4.2 (857, Sep 28 2805, 12: 41:115 [MSC v.1318 32 bit 《Intel>] on vin32 


ype "help", Aoeppright". "credits" or "license" for nore information. 


>>) print 'Hello World'" 
ello World?! 
>> “2 


SI NMINDOMS ss ysten325 





图 1-2 在 一 个 DOS/ 命 令 行 窗口 启动 Python 


1.5.2 ”从 命令 行 启 动 脚本 


Unix 衍 生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 ) 


ix 
X 
z9 
3 
En: 
e 
er 
— 

D 

o 


不 管 哪 种 Unix 平 台 ，Python 脚 本 都 可 以 像 下 面 这 样 ， 在 命令 行 上 通 i 
$ python script.py 
Python 脚 本 使 用 扩展 名 .py， 上 面 的 例子 也 说 明了 这 一 点 。 


Unix 平 台 还 可 以 在 不 明确 指定 Python 解释 器 的 情况 下 ， 自 动 执 行 Python 解释 器 。 如 果 你 使 用 
的 是 类 Unix 平 台 ， 你 可 以 在 你 的 脚本 的 第 一 行使 用 shell 魔 术 字 符 囊 (“sh-bang”) ° 


l/usr/local/bin/python 
EH! 之 后 写 上 Python 解释 器 的 完整 路 径 ， 我 们 前 面 曾 经 提 到 ，Python 解 释 器 通常 安装 


an 或 /usrbin 目 录 下 。 如 果 Python 没 有 安装 到 那里 ， 你 就 必须 确认 你 的 Python 解 
笃 器 确实 位 于 你 指定 的 路 径 。 错 误 的 路 径 将 导致 出 现 类 似 于 “ 找 不 到 命令 ”的 错误 信息 。 


有 一 个 更 好 的 方案 ， 许 多 Unix 系 统 有 一 个 命令 叫 env， 位 于 /bin 或 /usr/bin 中 。 它 会 帮 你 在 系统 
搜索 路 径 中 找到 python 解 释 器 。 如 果 你 的 系统 拥有 env， 你 的 启动 行 就 可 以 改 为 下 面 这 样 。 


l/usr/bin/env python 


或 者 ， 如 果 你 的 env 位 于 /bin 的 话 ， 


I/bin/env python 


当 你 不 能 确定 Python 的 具体 路 径 或 者 Python 的 路 径 经 常 变化 时 (但 不 能 挪 到 系统 搜索 路 径 之 
外 ) ，env 就 非常 有 用 。 当 你 在 你 的 脚本 首 行书 写 了 合适 的 启动 指令 之 后 ， 这 个 脚本 就 能 够 直 
接 执 行 。 当 调用 脚本 时 ， 会 先 载 入 Python 解 释 器 ， 然 后 运行 你 的 脚本 。 我 们 刚才 提 到 ， 这 样 
就 不 必 显 式 调 用 Python 解释 器 了 ， 而 只 需要 键入 脚本 的 文件 名 。 


$ script.py 


注意 ， 在 键入 文件 名 之 前 ， 必 须 先 将 这 个 文件 的 属性 设置 为 可 以 执行 。 在 文件 列表 中 ， 你 的 
文件 应 该 将 它 设置 为 自己 拥有 rwx 权 限 。 如 果 在 确定 Python 安装 路 径 ， 或 者 改变 文件 权限 ， 或 
使 用 chmod 命 令 时 遇 到 困难 ， 请 和 系统 管理 员 一 道 检 查 一 下 。 


Windows/DOS 环 境 


DOS 命 令 窗 口 不 支持 自动 执行 机 制 ， 不 过 至 少 在 WinXP 当 中 ， 它 能 像 在 Windows 中 一 样 做 到 

通过 输入 文件 名 执行 脚本 ， 这 就 是 “文件 类 型 "接口 。 这 个 接口 允许 Windows 根 据 文件 扩展 名 识 
别 文件 类 型 ， 从 而 调用 相应 的 程序 来 处 理 这 个 文件 。 举 例 来 说 ， 如 果 你 安装 了 带 有 PythonWin 
的 Python， 双 击 一 个 带 有 .py 扩展 名 的 Python 脚本 就 会 自动 调用 Python 或 PythonWin IDE. (如 
果 你 安装 了 的 话 ) 来 执行 你 的 脚本 。 运 行 以 下 命令 就 和 双击 它 的 效果 一 样 。 


C:\> script.py 


这 样 无 论 是 基于 Unix 操 作 系 统 还 是 Win32 操 作 系 统 都 可 以 无 需 在 命令 行 指定 Python 解释 器 的 
情况 下 运行 脚本 ， 但 是 如 果 调 用 脚本 时 ， 得 到 类 似 “ 命 令 无 法 识别 "之 类 的 错误 提示 信息 ， 你 也 
总 能 正确 处 理 。 


1.5.3 ”集成 开发 环境 


你 也 可 以 从 图 形 用 户 界 面 环境 运行 Python， 你 所 需要 的 是 支持 Python 的 GUI 程 序 。 如 果 你 已 
经 找到 了 一 个 ， 很 有 可 能 它 恰好 也 是 集成 开发 环境 。 集 成 开发 环境 不 仅仅 是 图 形 接 口 ， 通 常 
会 带 有 源 代码 编辑 器 、 追 踪 和 排 错 工具 。 


Unix 衍 生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 ) 


IDLE 可 以 说 是 Unix 平 台 下 Python 的 第 一 个 集成 开发 环境 (IDE) 。 最 初版 本 的 IDLE 也 是 Guido 
van Rossum 开 发 的 ， 在 Pythonl.5.2 中 ， 它 首次 露面 。IDLE 代 表 的 就 是 IDE， 只 不 过 多 了 一 
个 “L”。 我 猜测 ，IDLE 是 借用 了 “Monty Python” 一 个 成 员 的 名 字 [ 译 注 1]... 咽 ...IDLE 基 于 
Tkinter， 要 运行 它 的 话 你 的 系统 中 必须 先 安装 Tcl/Tk。 目 前 的 Python 发 行 版 都 带 有 一 个 迷你 版 
的 Tcl/Tk 库 ， 因 此 就 不 再 需要 Tcl/Tk 的 完整 安装 了 。 


如 果 你 已 经 在 系统 中 安装 好 了 Python， 或 者 你 有 一 个 Python RPM 包 ， 可 是 它 并 没有 包含 
IDLE 或 Tkinter， 那 在 你 尝试 IDLE 之 前 ， 必 须 先 将 这 两 样 东 西安 装 好 。 (如 果 你 需要 ， 确 实 有 
一 个 独立 的 Tkinter RPM 包 可 供 下 载 ， 以 便 和 Python 一 起 工作 ) 如 果 你 是 自己 编译 的 Python ， 
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而 且 有 Tk 库 可 用 ， 那 Tkinter 会 自动 编译 进 Python， 而 且 Tkinter 和 IDLE 也 会 随 Python 的 安装 而 


go 


Ep 


如 果 你 打算 运行 IDLE， 就 必须 找到 你 的 标准 库 安 装 位 置 : Jusr/local/lib/python2. 
x/idlelib/idle.py。 如 果 你 是 自己 编译 Python， 你 会 在 /usr/local/bin 目 录 中 发 现 一 个 名 为 idle 的 脚 
本 ， 这 样 你 就 可 以 在 shell 命 令 行 中 直接 运行 idle。 图 1-3 是 类 Unix 系 统 下 的 IDLE 界 面 。MacOS 
X 是 一 个 非常 类 似 Unix (基于 mach 内 核 ，BSD 服 务 ) 的 操作 系统 。 在 MacOS X 下 ，Python 可 
以 用 传统 的 Unix 编 译 工具 编译 。MacOS X 发 行 版 自 带 一 个 编译 好 的 Python 解释 器 ， 不 过 并 没 
有 任何 一 个 面向 Mac 的 特殊 工具 (比如 GNU readline > IDEF) ， 当 然 也 没有 Tkinter 和 IDLE ° 
你 可 能 会 打算 自己 下 载 并 编译 一 个 出 来 ， 不 过 要 小 心 一 点 ， 有 时 你 新 安装 的 Python 会 与 Apple 
预 装 的 版 本 混 消 在 一 起 。 认 真一 点 没有 坏处 。 你 也 可 以 通过 Fink/Finkcommander 和 
DarwinPorts 得 到 MacOS X 版 的 Python 。 

http://fink.sourceforge.net/ 

http://darwinports.org 

如 果 要 得 到 最 新 Mac 版 Python 的 组 建 和 信息 ， 请 访问 如 下 网 页 

http://undefined.org/python 

http://pythonmac.org/packages 


另 一 个 选择 是 从 Python 站 点 下 载 MacOS X 的 通用 二 进 制 包 。 这 个 磁盘 映像 文件 (DMG) 要 求 
操作 系统 版 本 至 少 为 10.3.9， 它 适用 于 基于 PowerPC 和 |ntel 硬 件 的 Mac 机 器 。 





Python 2.4 (#4, Mar 19 2005, 03:25:10) 

[GCC 3.3 20030304 (Apple Computer, Inc. build 1671)] on darwin 

Type "copyright", *credits* or *license()* for more information. 

d ttt ttt ttt ttt ttti ttttTTT*TTTY 
Personal firewall software may warn about the connection IDLE 
makes to its subprocess using this computer's internal loopback 
interface. This connection is not visible on any external 
interface and no data is sent to or received from the Internet. 
**ttttttttttttt extet tttttttttttttttttitttttttttttttttt ttt tt ttttttttt M, 


IDLE 1.1 


>>> 





i: 13 Ont: 4 





1-3 在 Unix 中 局 动 IDLE 
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Windows 环 境 


PythonWin 是 Python 的 第 一 个 Windows 接 口 ， 并 且 还 是 个 带 有 图 形 用户 界 面 的 集成 开发 环 
境 。 PythonWin 发 行 版 本 中 包含 WindowsAPI 和 COM 扩 展 。PythonWin 本 身 是 针对 MFC 库 编 
写 的 ， 它 可 以 作为 开发 环境 来 开发 你 自己 的 Windows 应 用 程序 。 你 可 以 从 下 面 给 出 的 网 页 中 
下 载 并 安装 它 。 


PythonWin 通 常 被 安装 在 和 Python 相同 的 目录 中 ， 在 它 自己 的 安装 目录 C: \Python2xLib\ site- 
packages\pythonwin 中 有 可 执行 的 启动 文件 pythonwin.exe。PythonWin 拥 有 一 个 带 有 闫 色 显 
示 的 编辑 器 、 一 个 新 的 增强 版 排 错 器 、 交 互 shell 窗 口 、COM 扩 展 和 更 多 的 有 用 特性 。 如 图 1-4 
就 是 运行 在 Windows 上 的 PythonWin 集 成 开发 环境 的 屏幕 截图 。 


eractive Wind 


Pythonwin 1.6a2 (#0, Apr 6 2000, 11:45:12) [MSC 32 bit (Intel)] on win32 
Copyright 1991-1995 Stichting Mathematisch Centrum, Amsterdam 

g Portions Copyright 1994-2000 Mark Hammond (MHammond(skippinet.com au) 
>>> 


yE'/usr/bin/env python 


import cgi 
from urllib import quote_plus 
from string import capvords 


# showFormI) » None 
“def showFonrm(wvho, howmany): 


'ehovForm(í() 一 ~ 


friends * 
for i in (0, 10, 25, 50, 100): 
checked * 





图 1-4 Windows 环 境 中 的 PythonWin 


你 可 以 在 下 面 由 Mark Hammond 维 护 的 网 站 中 找到 更 多 的 关于 PythonWin 和 Python 针对 
Windowns 的 扩展 〈 也 被 称 为 “win32all") ° 


http://starship.python.net/crew/mhammond/win32/ 
http://sourceforge.net/projects/pywin32/ 


IDLE 也 有 Windows 平 台 版 本 ， 这 是 由 Tcl/Tk 和 Python/Tkinter 的 跨 平台 性 特点 决定 的 ， 它 看 上 
去 很 像 Unix 平 台 下 的 版 本 ， 如 图 1-5 所 示 。 


第 1 章 “欢迎 来 到 Python 世界 s 


Python Shell [alolx 
Ele Edt Shel Debug Options Windows Hel - 7 


Python 2.4.2 (867, Sep 28 2005, 12:41:11) [MSC v.1310 32 bit (Intel)] on win32 
Type 'copyright*, "credits" or *license()* for more information. 





AARAAAARRARARRSRASMSATARAT ETAT T RANA ht ttt4thttttttt t té 4444 tte ted ththt*ttt* 
Personal firewall software may warn about the connection IDLE 
makes to its subprocess using this computer's internal loopback 
interface. This connection is not visible on any external 


interface and no data is sent to or received from the Internet. 
ETE 


IDLE 1.1.2 


»»2 Hello World! 
Hello World! 


1-5 在 Windows 中 局 动 IDLE 


在 Windows 平 台 下 ，IDLE 可 以 在 Python 编 译 器 通 党 所 在 的 目录 C:\Python2x 下 的 子 目 录 
Lib\idlelib 中 找到 。 从 DOS 命 令 行 窗口 中 局 动 IDLE， 请 调用 idle.py。 你 也 可 以 从 Windows 环 境 
中 调用 idle.py ， 但 是 会 启动 一 个 不 必要 的 DOS 窗 口 。 取 而 代 之 的 方法 是 双击 idle.pyw ， 以 .pyw 
作为 扩展 名 的 文件 不 会 通过 打开 DOS 命 令 行 窗口 来 运行 脚本 。 事 实 上 你 可 以 在 桌面 上 创建 一 
个 到 C:\Python2x\Lib\idlelib\idle.pyw 的 快捷 方式 ， 然 后 双击 启动 就 可 以 了 ， 简 单 吧 ! 

1.5.4 其 他 的 集成 开发 环境 和 执行 环境 


很 多 的 软件 开发 专家 事实 上 会 选择 在 他 们 喜欢 的 文本 编辑 器 中 编写 代码 ， 比 如 vi (m) 或 者 
emacso 除 了 这 些 和 上 面 提 到 到 的 集成 开发 环境 ， 还 有 大 量 的 开源 和 商业 的 集成 开发 环境 ， 下 
面 是 个 简短 的 列表 。 


开源 
e IDLE (在 Python 发 行 版 中 自 带 ) 
http://python.org/idle/ 
e PythonWin+Win32 Extensions 
http://starship.python.net/crew/skippy/win32 
e IPython (E zx 5 x: z X Python) 


http://ipython.scipy.org 


e IDE Studio (IDLE 以 及 更 多 ) 
http://starship.python.net/crew/mike/ldle 
e Eclipse 
http://pydev.sf.net 
http://eclipse.org/ 
商业 
。 WingWare 开 发 的 WinglIDE Python 集成 开发 环境 
http://wingware.com/ 
e ActiveState 开 发 的 Komodo 集 成 开发 环境 
http://activestate.com/Products/Komodo 
通用 集成 开发 环境 列表 


http://wiki.python.org/moin/IntegratedDevelopmentEnvironments 


核心 提示 : 运行 本 书 中 的 代码 实例 


在 本 书 中 ， 你 会 发 现 很 多 的 Python 脚本 样 例 ， 可 以 从 本 书 的 网 站 上 下 载 。 但 是 当 你 运行 它们 
的 时 候 ， 请 记 住 这 些 代码 是 设计 用 来 从 命令 行 (DOS 命 令 行 窗口 或 Unix shell) 或 者 集成 开发 
环境 执行 的 。 如 果 你 在 使 用 Win32 系 统 ， 双 击 Python 程 序 会 打开 DOS 窗 口 ， 但 是 在 脚本 执行 
完毕 后 就 会 关闭 ， 所 以 你 可 能 看 不 到 输出 结果 。 如 果 你 遇 到 了 这 种 情况 ， 就 直接 打开 DOS 窗 

从 命令 行 中 运行 相关 的 脚本 ， 或 者 在 集成 开发 环境 中 执行 脚本 。 另 外 一 种 办 法 ， 就 是 在 
o 面 添 加 raw_input() 语 句 ， 这 样 就 可 以 保持 窗口 开 着 ， 直 到 你 按 下 回 车 键 才 
关闭 。 


1.6 Python X 


Python 文档 可 以 在 很 多 地 方 找到 ， es dM wa 如 果 你 没 
上 网 ， 并 且 使 用 的 是 Win32 系 统 ， 那 么 在 CA\Python2Xx\Doc\ 目 录 下 会 找到 一 个 名 为 
Python2x.chm 的 离线 帮助 文档 。 ER， ， 所 以 你 实际 上 是 使 用 网 页 浏览 器 来 查看 文 
档 。 其 他 的 离线 文档 包括 PDF 和 PostScript (PS) 文件 。 最 后 ， 如 果 你 下 载 了 Python 发 行 
版 ， 你 会 得 到 LaTeX 格 式 的 源 文件 。 


在 本 书 的 网 站 中 ， 我 们 创建 了 一 个 包括 绝 大 多 数 Python 版 本 的 文档 ， 只 要 访问 
http://corepython.com， 单 击 左 侧 的 “Documentation” 就 可 以 了 。 


1.7 ”比较 Python (Python 与 其 他 语言 的 比较 ) 


Python 已 经 和 很 多 语言 比较 过 了 。 一 个 原因 就 是 Python 提 供 了 很 多 其 他 语言 拥有 的 特性 ， 另 
外 一 个 原因 就 是 Python 本 身 也 是 由 诸多 其 他 语言 发 展 而 来 的 ， 包 括 ABC、Modula-3、C、 
C++ ` Algol-68 ` SmallTalk ^ Unix shell 和 其 他 的 脚本 语言 ， 等 等 。Python 就 是 “浓缩 的 精 
4£" : Van Rossum 研 究 过 很 多 语言 ， 从 中 吸收 了 许多 觉得 不 错 的 特性 ， 并 将 它们 溶 于 一 炉 。 


然而 ， 往 往 因为 Python 是 一 门 解释 型 语言 ， 你 会 发 现 大 多 数 的 比较 是 在 Perl、Java、Tel， 还 
有 JavaScript 之 间 进 行 的 。Perl 是 另外 一 种 脚本 语言 ， 远 远 超越 了 标准 的 shell 脚 本 。 像 Python 
一 样 ，Perl 赋 了 予 了 你 所 有 编程 语言 的 功能 特性 ， 还 有 系统 调用 能 力 。 


Perl 最 大 的 优势 在 于 它 的 字符 串 模 式 匹配 能 力 ， 其 提供 了 一 个 十 分 强大 的 正则 表达 式 匹配 引 

擎 。 这 使 得 Perl 实 际 上 成 为 了 一 种 用 于 过 滤 、 识 别 和 抽取 字符 囊 文本 的 语言 ， 而 且 它 一 直 是 开 
发 Web 服 务 器 端 CGI (common gateway interface， 通 用 网 关 接 口 ) 网 络 程序 的 最 流行 的 语 
言 。Python 的 正则 表达 式 引 擎 很 大 程度 上 是 基于 Perl 的 。 


然而 ，Perl 语 言 的 上 星 涩 和 对 符号 语法 的 过 度 使 用 ， 让 解读 变 得 很 困难 。 这 些 语法 令 初 学 者 不 得 
精 要 ， 为 他 们 的 学 习 带 来 了 不 小 的 阻碍 。Perl 的 这 些 额 外 的 “特色 ”使 得 完成 同一 个 任务 会 有 多 
个 方法 ， 进 而 引起 了 开发 者 之 间 的 分 歧 。 最 后 ， 通 常 当 你 想 阅 读 几 个 月 前 写 的 Perl 脚 本 的 时 候 
都 不 得 不 求助 参考 书 。 


Python 也 经 常 被 拿 来 和 Java 作 对 比 ， 因 为 他 们 都 有 类 似 的 面向 对 象 的 特性 和 语法 。Java 的 语 
法 尽管 比 C++ 简 单 的 多 ， 但 是 依旧 有 些 繁琐 ， 尤 其 是 当 你 想 完成 一 个 小 任务 的 时 候 。Python 
的 简洁 与 纯粹 使 用 Java 相 比 提供 了 更 加 快速 的 开发 环境 。 在 Python 和 Java 的 关系 上 ， 一 个 非 
常 重大 的 革命 就 是 Jython 的 开发 。Jython 是 一 个 完全 用 Java 开 发 的 Python 解释 器 ， 现 在 可 以 
在 只 有 Java 虚 拟 机 的 环境 中 运行 Python 程序 。 我 们 会 在 后 面 的 章节 中 简单 讲述 Jython 的 更 多 
优点 ， 但 是 现在 就 可 以 告诉 你 : 在 Jython 的 脚本 环境 中 ， 你 可 以 熟练 地 处 理 Java 对 象 ，Java 
可 以 和 Python 对 象 进行 交互 ， 你 可 以 访问 自己 的 Java 标 准 类 库 ， 就 如 同 Java 一 直 是 Python 环 
境 的 一 部 分 一 样 。 


现在 ， 由 于 Rails 项 目的 流行 ，Python 也 经 常 被 拿 来 和 Ruby 进 行 比较 。 就 像 前 面 我 们 提 到 的 ， 
Python 是 多 种 编程 范式 的 混合 ， 它 不 像 Ruby 那 样 完全 面向 对 象 ， 也 没有 像 Smalltalk 那 样 的 

块 ， 或 许 这 正 是 Ruby 最 引 人 注 目的 特性 。Python 有 一 个 字 节 码 解 释 器 ， 而 Ruby 没 有 。Python 
更 加 易 读 ， 而 Ruby 事 实 上 可 以 看 作 是 面向 对 象 的 Perl。 相 对 于 Rails, Python 有 几 个 自己 的 
Web 应 用 框架 ， 比 如 Django 和 Turbogears 这 两 个 项 目 。 


Tcl 是 另 一 种 可 以 与 Python 相提并论 的 脚本 语言 。Tcl 是 最 易于 使 用 的 脚本 语言 之 一 ， 程 序 员 很 
容易 像 访 问 系统 调用 一 样 对 Tcl 语 言 进行 扩展 。Tcl 直 到 今天 仍然 很 流行 ， 与 Python 相 比 ， 它 或 
许 有 更 多 局 限 性 〈 主 要 是 因为 它 有 限 的 几 种 数据 类 型 ) ， 不 过 它 也 拥有 和 Python 一 样 的 通过 

扩展 超越 其 原始 设计 的 能 力 。 更 重要 的 是 ，Tcl 通 常 总 是 和 它 的 图 形 工具 包 Tk 一 起 工作 ， 一 起 


协同 开发 图 形 用 户 界面 应 用 程序 。 因 为 它 非 常 流行 ， 所 以 Tk 已 经 被 移植 到 Perl (Perl/Tk) 和 
Python (Tkinter) 中 。 同 样 有 一 个 有 争议 的 观点 ， 那 就 是 与 Tcl 相 比 ， 因 为 Python 有 类 、 模 块 
及 包 的 机 制 ， 所 以 写 起 大 程序 来 更 加 得 心 应 手 。 


Python 有 一 点 点 函数 化 编程 (functional programming, FP) 结构 ， 这 使 得 它 有 点 类 似 于 List 
或 Scheme 语言 。 尽 管 Python 不 是 传统 的 函数 化 编程 语言 ， 但 它 持 缚 "elis BT 
借用 一 些 有 价值 的 特性 。 举 例 来 说 ， 列 表 解 析 就 是 一 个 广 受 欢迎 的 来 自 Haskell 的 特性 ， 而 
Lisp 程 序 员 在 遇 到 lambda、map、filter 和 reduce 时 也 会 感到 异常 亲切 。 


JavaScript 是 另外 一 种 非常 类 似 Python 的 面向 对 象 脚本 语言 。 优 秀 的 JavaScript 程 序 员 学 起 
We 。 聪 慧 的 读者 会 注意 到 JavaScript 是 基于 原型 系统 的 ， 而 Python 则 遵循 传统 
的 面向 对 象 系统 ， 这 使 得 二 者 的 美和 对 象 有 一 些 差异 。 


下 面 列 出 了 有 关 Python 与 其 他 语言 进行 比较 的 网 页 。 

Perl 

http://www2.linuxjournal.com/article/3882 
http://Ilama.med.harvard.edu/-fgibbons/PerlPythonPhrasebook.html 
http://aplawrence.com/Unixart/pythonvsperl.html 
http://pleac.sf.net/pleac python 
http://www.garshol.priv.no/download/text/perl.html 

Java 

http://dirtsimple.org/2004/12/python-is-not-java.html 
http://twistedmatrix.com/users/glyph/rant/python-vs-java.html 
http://hnetpub.cstudies.ubc.ca/oleary/python/python java comparison.php 
Lisp 

http://strout.net/python/pythonvslisp.html 
http://horvig.com/python-lisp.html 

Ruby 

http://blog.ianbicking.org/ruby-python-power.html 
http://www.rexx.com/--oinkoink/Ruby v Python.html 
http://dev.rubycentral.com/faq/rubyfaq-2.html 


Perl ^ C++ 


E. Zil DuthaOnad- X 
2| Python t4 


http://strombergers.com/python/ 

Perl ` Java ` C++ 

http://furryland.org/~mikec/bench/ 

C++ ` Java ` Ruby 

http://dmh2000.com/cjpr 

Perl, Java, PHP, Tcl 
http://www-128.ibm.com/developerworks/linux/library/1-python101.html 
http://www-128.ibm.com/developerworks/linux/library/1-script-survey/ 
C ` C++ » Java ` Perl ` Rexx ` Tel 
http://www.ubka.uni-karlsruhe.de/indexer-vvv/ira/2000/5 

你 可 以 在 下 面 的 网 址 中 看 到 更 多 Python 与 其 他 的 语言 的 比较 : 


http://www.python.org/doc/Comparisons.html 


1.8 其 他 实现 


标准 版 本 的 Python 是 用 C 来 编译 的 ， 又 被 称 为 Cpython。 除 此 之 外 ， 还 有 一 些 其 他 的 Python 实 
现 。 我 们 将 在 下 面 讲述 些 实现 ， 除 了 本 书 中 提 到 的 这 些 实现 以 外 ， 下 面 的 网 址 还 有 更 多 的 实 
现 版 本 。 


http://python.org/dev/implementations.html 


Java 


我 们 在 上 一 节 中 曾经 提 到 ， 还 有 一 个 可 以 用 ERG oe 写成 的 ， 名 为 
Jython。 尽 管 两 种 解释 器 之 间 存 在 一 些 细微 的 差别 ， 但 是 它们 非常 接近 ， 而 且 启 动 环境 也 完 
全 相同 。 那 Jython 又 有 哪些 优势 呢 ? Jython... 


e 只 要 有 Java 虚 拟 机 ， 就 能 运行 Jython ° 
e 拥有 访问 Java 包 与 类 库 的 能 力 。 

。 为 Java 开 发 环境 提供 了 脚本 引擎 。 

e 能 够 很 容易 的 测试 Java 类 库 。 

e. 提供 访问 Java 原 生 异 常 处 理 的 能 力 。 


e 继承 了 JavaBeans 特 性 和 内 省 能 力 


e 鼓励 Python 到 Java 的 开发 (反之 亦 然 ) 。 
e GUI 开发 人 员 可 以 访问 Java 的 AWT/Swing 库 。 
e 利用 了 Java 原 生 垃 圾 收集 器 (CPython 未 实现 此 功能 ) 。 


对 Jython 进 行 详细 论述 ， 超 出 了 本 文 的 范围 ， 不 过 网 上 有 非常 多 的 Jython 信 息 。Jython 目 前 仍 
然 在 不 断 开发 之 中 ， 不 时 会 增加 新 的 特性 。 你 可 以 通过 访问 Jython 的 网 站 得 到 更 多 有 用 的 信 
B. 。 


http://jython.org 
.NET/Mono 


现在 已 经 有 一 个 名 为 IronPython 的 Python 实现 ， 它 是 用 C# 语 言 完 成 的 ， 它 适用 的 环境 是 .NET 
和 Mono。 你 可 以 在 一 个 .NET 应 用 程序 中 整合 IronPython 解 释 器 来 访问 .NET 对 和 象 。ronPython 
的 扩展 可 以 用 C# 或 VB.NET 语 言 编写 。 除 此 之 外 ， 还 有 一 种 名 为 Boo 的 .NET/Mono 语 言 。 你 可 
以 在 下 面 的 网 址 获得 更 多 关于 IronPython 和 Boo 语 言 的 信息 。 


http://codeplex.com/Wiki/View.aspx?ProjectName-lronPython 
http://boo.codehaus.org/ 
Stackless 


CPython 的 一 个 局 限 就 是 每 个 Python 有 函数 调用 都 会 产生 一 个 C 函 数 调 用 (从 计算 机 科学 的 角度 
来 说 ， 我 们 在 讨论 栈 帧 ) 。 这 意味 着 同时 产生 的 函数 调用 是 有 限制 的 ， 因 此 Python 难 以 实现 
用 户 级 的 线程 库 和 复杂 递归 应 用 。 一 旦 超越 这 个 限制 ， 程 序 就 会 崩溃 。 你 可 以 通过 使 用 一 
^*"stackless*& Python 实 现 来 突破 这 个 限制 ， 一 个 C 栈 帧 可 以 拥有 任意 数量 的 Python 栈 帧 ， 
这 样 你 就 能 够 拥有 几乎 无 穷 的 函数 调用 ， 并 能 支持 巨大 数量 的 线程 ， 这 个 Python 实现 的 名 字 
就 叫 ......Stackless (嘿嘿 ， 很 惊讶 吗 ? ) 


Stackless 唯 一 的 问题 就 是 它 要 对 现 有 的 CPython 解 释 器 做 重大 修改 ， 所 以 它 几乎 是 一 个 独立 
的 分 支 。 另 一 个 名 为 Greenlets 的 项 目 也 支持 微 线 程 ， 它 是 一 个 标准 的 C 扩 展 ， 因 此 不 需要 对 
标准 Python 解释 器 做 任何 修改 。 通 过 以 下 网 址 你 能 了 解 更 多 信息 。 


http://stackless.com 


http://codespeak.net/py/current/doc/greenlet.html 


1.9 练习 


Python 核心 编程 第 二 版 


1-1. 安 装 Python。 请 检查 Python 是 否 已 经 安装 到 你 的 系统 上 ， 如 果 没 有 ， 请 下 载 并 安装 


1-2. 执 行 Python。 有 多 少 种 运行 Python 的 不 同方 法 ? 你 喜欢 哪 一 种 ? 为 什么 ? 
1-3.Python 标 准 库 。 

(a) 请 找到 系统 中 Python 执 行程 序 的 安装 位 置 和 标准 库 模块 的 安装 位 

(b) 看 看 标准 库 里 的 一 些 文件 ， 比 如 string.py。 这 会 帮助 你 适应 阅读 Python 脚 本 。 


1-4. 交 互 执 行 。 启 动 你 的 Python 交 互 解释 器 。 你 可 以 通过 输入 完整 的 路 径 名 来 启动 它 。 
当然 ， 如 果 你 PUE TET 它 的 位 置 ， 那 么 只 输入 它 的 名 字 (python 或 者 
python.exe) 就 行 了 (你 可 以 任 选 最 适合 你 的 的 Python 实现 方式 ， 例 如 命令 行 、 图 形 用 
户 接口 /集成 开发 环境 、Jython、 ee 。 启 动 界面 看 上 去 就 像 本 章 
描述 的 一 样 ， 一 旦 你 看 到 >>> 提 示 符 ， 就 意味 着 解释 器 准备 好 要 接受 你 的 Python 命令 

了 。 


试 着 输入 命令 print Hello World" (然后 按 回 车 键 ) ， 完 成 著名 的 Hello World! 程 序 ， 
然后 退 。 解 释 器 。 在 Unix 系 统 中 ， 按 下 Ctrl+D 会 发 送 EOF 信 号 来 中 止 Python 解释 器 ， 
在 DOS 系 统 中 ， 使 用 的 组 合 键 是 Ctrl+Z。 如 果 要 从 Macintosh、PythonWin、 
Windows 或 Unix 中 的 IDLE 这 样 的 图 形 用 户 环境 中 退出 ， 只 要 简单 的 关闭 相关 窗口 就 
可 以 了 。 


1-5. 编 写 脚 本 。 作 为 练习 1-4 的 延续 ， 创 建 “Hello Worldy 的 Python 脚本 其 实 和 上 面 的 交互 
性 练习 并 不 是 一 回 事 。 如 果 你 在 使 用 Unix 系 统 ， 尝 试 建立 自动 运行 代码 行 ， 这 样 你 就 可 
以 在 没有 调用 Pyton 解 释 器 的 情况 下 运行 程序 了 。 


1-6. 编 写 脚本 。 使 用 print 语 名 编写 脚本 ， 在 屏幕 上 显示 你 名 字 、 年 龄 、 最 喜欢 的 颜色 和 与 
你 相关 的 一 些 事情 (背景 、 兴 趣 、 爱 好 等 ) 。 
译注 1: Monty Python, 也 称 “ 蒙 地 蟒蛇 “, 是 美国 的 一 个 6 人 音 剧 团体 ， 在 20 世 纪 70 年 代 的 电视 
剧 和 80 年 代 的 电影 作品 红 极 一 时 。Guido van Rossum 就 是 该 团体 的 忠实 影 剧 迷 ， 故 而 将 本 语 
言 命 名 为 Python。 这 里 的 IDLE 指 的 是 其 成 员 Eric Idle ° 
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本 章 将 对 Python 的 主要 特性 做 一 个 快速 介绍 ， 这 样 你 就 可 以 借助 以 前 的 编程 经 验 识别 出 熟悉 
的 语言 结构 ， 并 立刻 将 Python 付 诸 使 用 。 虽然 细节 内 容 会 在 后 续 的 章节 中 逐一 讲解 ， 但 是 对 
整体 的 了 解 可 以 让 你 迅速 融入 到 Python 中 。 阅 读本 章 的 最 好 的 方法 就 是 在 电脑 上 打开 Python 
解释 器 ， 尝 试 书 中 的 示例 ， 当 然 也 可 以 随心 所 谷地 自己 做 实验 。 


我 们 已 经 在 第 1 章 和 练习 1-4 中 介绍 了 如 何 启 动 Python 解释 器 。 在 所 有 的 交互 示例 中 ， 你 会 看 
到 Python 的 主 提示 符 (>>>) 和 次 提示 符 (...) 。 主 提示 符 是 解释 器 告诉 你 它 在 等 待 你 输入 下 
一 个 语句 ， 次 提示 符 告 诉 你 解释 器 正在 等 待 你 输入 当前 语句 的 其 他 部 分 。 


Python 有 两 种 主要 的 方式 来 完成 你 的 要 求 : 语句 和 表达 式 (RECO RORGAGA AGER) 。 相 信 大 
部 分 读者 已 经 了 解 二 者 的 不 同 ， 但 是 不 管 怎 样 ， 我 们 还 是 再 来 复习 一 下 。 语 多 使 用 关键 字 来 
组 成 命令 ， 类 似 告诉 解释 器 一 个 命令 。 你 告诉 Python 做 什么 ， 它 就 为 你 做 什么 ， 语 名 可 以 有 
输出 ， 也 可 以 没有 输出 。 下 面 我 们 先 用 print 语 句 完成 程序 员 们 老生 常 谈 第 一 个 编程 实例 ， 
Hello World ° 


>>> print 'Hello World!' 

Hello World! 

而 表达 式 没 有 关键 字 。 它 们 可 以 是 使 用 数学 操作 符 构成 的 算术 表达 式 ， 也 可 以 是 使 用 括号 调 
用 的 函数 。 它 们 可 以 接受 用 户 输入 ， 也 可 以 不 接受 用 户 输入 ， 有 些 会 有 输出 ， 有 些 则 没有 。 
(在 Python 中 未 指定 返回 值 的 函数 会 自动 返回 None, 等 价 于 NULL) 下 面 举 一 个 例子 ， 函 数 
abs() 接 受 一 个 数值 输入 ， 然 后 输出 这 个 数值 的 绝对 值 。 


>>> abs(4) 
4 
>>> abs(-4) 


E 


本 章 中 我 们 将 分 别 介绍 语句 和 表达 式 。 我 们 先 来 研究 print 语 多。 


2.4 程序 输出 ,print 语 名 及 “Hello World!“ 


有 些 语言 ， 比 如 C, 通 过 函数 输出 数据 到 屏幕 ， 例 如 部 数 printfO。 然 而 在 Python 和 大 多 数 解释 
执行 的 脚本 语言 中 ， 则 使 用 语句 进行 输出 。 很 多 的 shell 脚 本 语言 使 用 echo 命 令 来 输出 程序 结 
o 


核心 笔记 : 在 交互 式 解释 器 中 显示 变量 的 值 
通常 当 你 想 看 变量 内 容 时 ， 你 会 在 代码 中 使 用 print 语 多 输出 。 不 过 在 交互 式 解释 器 中 ， 你 可 
以 用 print 语 句 显示 变量 的 字符 串 表 示 ， 或 者 仅 使 用 变量 名 查看 该 变量 的 原始 值 。 
在 下 面 的 例子 中 ， 我 们 把 一 个 字符 串 赋 值 给 变量 myString， 先 用 print 来 显示 变量 的 内 容 ， 之 后 
用 变量 名 称 来 显示 。 
>>> myString = 'Hello World!' 
>>> print myString 
Hello World! 
>>> myString 
'Hello World!' 


注意 ， 在 仅 用 变量 名 时 ， 和 输出 的 字符 串 是 用 单 引号 括 起 来 了 的 。 这 是 为 了 让 非 字 符 串 对 象 也 
能 以 字符 串 的 方式 显示 在 屏幕 上 一 一 即 它 显示 的 是 该 对 象 的 字符 串 表 示 ， 而 不 仅仅 是 字符 串 
本 身 。 引 号 表示 你 刚刚 输入 的 变量 的 值 是 一 个 字符 串 。 等 你 对 Python 有 了 较 深 入 的 了 解 之 
后 ， 你 就 会 知道 print 语 名 调用 str() 函 数 显 示 对 象 ， 而 交互 式 解释 器 则 调用 repr() 函 数 来 显示 对 
象 。 


TA (C) 在 解释 器 中 有 特别 的 含义 ， 表 示 最 后 一 个 表达 式 的 值 。 所 以 上 面 的 代码 执行 之 
后 ， 下 划 线 变量 会 包含 字符 囊 。 


222 
Hello World! 


Python 的 print 语 句 ， 与 字符 串 格 式 操 作 符 (%) 结合 使 用 ， 可 实现 字符 串 替 换 功 能 ， 这 一 点 
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>>> print "$s is number $d!" $ ("Python", 1) 
Python is number 1! 


%s 表 示 由 一 个 字符 串 来 蔡 换 ， 而 %d 表 示 由 一 个 整 型 来 替换 ， 另 外 一 个 很 常用 的 就 是 %f, 它 表 
示 由 一 个 浮 点 型 来 蔡 换 。 我 们 会 在 本 章 中 看 到 更 多 类 似 的 例子 。Python 非 常 灵 活 ， 所 以 即使 
你 将 数字 传递 给 %s, 也 不 会 像 其 他 要 求 严格 的 语言 一 样 引 发 严重 后 果 。 参 阅 6.4.1 节 以 了 解 更 多 
关于 字符 串 格 式 操 作 符 的 信息 。Print 语 句 也 支持 将 输出 重 定向 到 文件 。 这 个 特性 是 从 
Python2.0 开 始 新 增 的 。 符 号 >> 用 来 重 定向 输出 ， 下 面 这 个 例子 将 输出 重 定向 到 标准 错误 输 
出 。 


import sys 
print >> sys.stderr, 'Fatal error: invalid input!' 


下 面 是 一 个 将 输出 重 定向 到 日 志文 件 的 例子 。 


logfile = open('/tmp/mylog.txt', 'a') 
print >> logfile; 'Fatal error: invalid input!' 
logfile.close() 


2.2 程序 输入 和 raw_input() 内 建 函 数 


从 用 户 那 里 得 到 数据 输入 的 最 容易 的 方法 是 使 用 raw_input() 内 建 函 数 。 它 读 取 标准 输入 ， 并 
将 读 取 到 的 数据 赋值 给 指定 的 变量 。 你 可 以 使 用 into 内 建 函 数 将 用 户 输入 的 字符 串 转换 为 束 


型 。 


>>> user = raw input('Enter login name: ') 
Enter login name: root 

>>> print 'Your login is:', user 

Your login is: root 


上 面 这 个 例子 只 能 用 于 文本 输入 。 下 面 是 输入 一 个 数值 字符 串 (并 将 字符 串 转 换 为 整 型 ) 的 
例子 : 


>>> num = raw input('Now enter a number: ') 

Now enter a number: 1024 

>>> print 'Doubling your number: $d' $ (int(num) * 2) 
Doubling your number: 2048 


内 建 函 数 int() 将 数值 字符 串 转换 成 整 型 值 ， 这 样 才 可 以 对 它 进行 数学 运算 。 参 阅 第 6.5.3 节 以 
了 解 更 多 有 关内 建 函 数 raw_input() 的 知识 。 


核心 笔记 : 从 交互 式 解释 器 中 获得 帮助 


在 学 习 Python 的 过 程 中 ， 如 果 需 要 得 到 一 个 生疏 函数 的 帮助 ， 只 需要 对 它 调用 内 建 济 数 
help()。 通 过 用 函数 名 作为 help() 的 参数 就 能 得 到 相应 的 帮助 信息 。 
>>> help(raw_input) 
Help on built-in function raw input in module builtin 
raw input(...) 
raw input([prompt]) -» string 


从 标准 输入 读 取 一 个 字符 串 并 自动 删除 串 尾 的 换行 字符 。 如 果 用 户 键入 了 EOF 字 符 〈Unix: 
Ctrl+D, Windows: Ctrl+Z+ 回 车 ) ， 则 引发 EOFError, 在 Unix 平 台 ， 只 要 可 用 ， 就 使 用 GNU 
readline 库 。 如 果 提 供 提 示 字 符 串 参数 ， 则 显示 该 字符 , 串 并 自动 删 去 字符 串 末 尾 的 换行 字符 。 








(本 段 是 help (raw. input) 的 输出 ， 译 文 是 对 其 加 以 解释 ， 方 便 读者 理解 一 一 译 者 注 ) 
核心 风格 : 一 直 在 函数 外 做 用 户 交 互 操作 
新 手 在 需要 显示 信息 或 得 到 用 户 输入 时 ， 很 容易 想到 使 用 print 语 名 和 raw_input() 内 建 函 数 。 


不 过 我 们 在 此 建议 函数 应 该 保持 其 清晰 性 ， 也 就 是 它 只 应 该 接受 参数 ， 返 回 结 果 。 从 用 户 那 
里 得 到 需要 的 数据 ， 然 后 调用 函数 处 理 ， 从 函数 得 到 返回 值 ， 然 后 显示 结果 给 用 户 。 这 样 你 
就 能 够 在 其 他 地 方 也 可 以 使 用 你 的 函数 而 不 必 担 心 自 定义 输出 的 问题 。 这 个 规则 的 一 个 例外 
是 ， 如 果 函 数 的 基本 功能 就 是 为 了 得 到 用 户 输出 ， 或 者 就 是 为 了 输出 信息 ， 这 时 在 函数 内 使 


用 print 语 句 或 raw_input() 也 未 尝 不 可 。 更 重要 的 是 ， 将 函数 分 为 两 大 类 ， 一 类 只 做 事 ， 不 需 
要 返回 值 (比如 与 用 户 交 互 或 设置 变量 的 值 ) ， 另 一 类 则 执行 一 些 运 算 ， 最 后 返回 结果 。 如 
果 输 出 就 是 函数 的 目的 ， 那 么 在 函数 体内 使 用 print 语 句 也 是 可 以 接受 的 选择 。 

2.3 ix 


和 大 部 分 脚本 及 Unix-shell 语 言 一 样 ，Python 也 使 用 # 符 号 标示 注释 ， 从 # 开 始 ， 直 到 一 行 结束 
的 内 容 都 是 注释 。 


>>> # one comment 
print 'Hello World!' # another comment 


Hello World! 


有 一 种 叫做 文档 字符 串 的 特别 注释 。 你 可 以 在 模块 、 类 或 者 函数 的 起 始 添加 一 个 字符 串 ， 起 
到 在 线 文档 的 功能 ， 这 是 Java 程 序 员 非常 熟悉 的 一 个 特性 。 


def foo(): 
"Ihis i13 a doc string." 


return True 
与 普通 注释 不 同 ， 文 档 字符 串 可 以 在 运行 时 访问 ， 也 可 以 用 来 自动 生成 文档 。 


B, AA 
2.4 操作 符 
和 其 他 绝 大 多 数 的 语言 一 样 ，Python 中 的 标准 算术 操作 符 以 你 熟悉 的 方式 工作 。 
* m * / ff % xk 


加 、 减 、 乘 、 除 和 取 余 都 是 标准 操作 符 。Python 有 两 种 除法 操作 符 ， 单 斜 杠 用 作 传统 除法 ， 
双 斜 杠 用 作 浮 点 除法 〈 对 结果 进行 四 舍 五 入 ) 。 传 统 除 法 是 指 如 果 两 个 操作 数 都 是 整 型 的 
话 ， 它 将 执行 的 是 地 板 除 ( 取 比 商 小 的 最 大 整数 ) (关于 “地 板 除 “请 参考 第 5 章 译 者 
iR) ， 而 浮 点 除法 是 丨 正 的 除法 ， 不 管 操作 数 是 什么 类 型 ， 浮 点 除法 总 是 执行 卜 正 的 除法 。 
你 可 以 在 第 5 章 学 到 更 多 有 关 传 统 除 法 、 织 正 的 除法 及 浮 点 除法 的 知识 。 





还 有 一 个 乘 方 操作 符 ， 双 星 号 (*) 。 尽 管 我 们 一 直 强 调 这 些 操作 符 的 算术 本 质 ， 但 是 请 注意 
对 于 其 他 数据 类 型 ， 有 些 操作 符 是 被 重 载 了 ， 比 如 字符 串 和 列表 。 让 我 们 看 一 个 例子 。 


>>> print -2 * 4 + 3 **2 


1 


就 像 你 看 到 的 ， 操 作 符 的 优先 级 和 你 想象 的 一 样 : + 和 -优先 级 最 低 ，*、/、/W/、% 优 先 级 较 
高 ， 单 目 操作 符 + 和 -优先 级 更 高 ， 乘 方 的 优先 级 最 高 。 (3**2) 首先 求 值 ， 然 后 是 (-24) ， 
然后 是 对 两 个 结果 进行 求 和 。 


Python 当 然 也 有 标准 比较 操作 符 ， 比 较 运 算 根据 表达 式 的 值 的 丨 假 返回 布尔 值 。 


< . > >= == l= <> 


试 一 试 ,看 看 这 些 比较 运算 会 得 到 什么 结果 。 


2s 2 o m8 


True 


| 
Il 
D. 


>>> 2 
False 
>>> 2 > g 
False 
>>> 6.2 X= 6 
False 
»»» 6.2 «- 6.2 
True 
55» 6.2 = 6.20001 
True 
Python 目前 支持 两 种 “不 等 于 “比较 操作 符 ，!1 = 和 <>， 分 别 是 C 风 格 和 ABC/Pascal 风 格 。 目 前 
后 者 慢 慢 地 被 淘汰 了 ， 所 以 我 们 推荐 使 用 前 者 。 
Python 也 提供 了 人 逻辑 操作 符 。 


and or not 


使 用 逻辑 操作 符 可 以 将 任意 表达 式 连 接 在 一 起 ， 并 得 到 一 个 布尔 值 。 


>>> 2 < 4 and 2 == 4 
False 

ao Zo 5 OE Z «4 
True 

»»» not 6.2 <= 6 
True 

ooo 4X 4 3*5 

True 

最 后 一 个 例子 在 其 他 语言 中 通常 是 不 合法 的 ， 不 过 Python 支持 这 样 的 表达 式 ， 既 简洁 又 优 

美 。 它 实际 上 是 下 面 表 达 式 的 缩写 : 
>>> 3 < Qoaand 4 < 5 


参阅 4.5 节 以 得 到 更 多 有 关 Python 操 作 符 的 信息 。 





核心 风格 : 合理 使 用 括号 增强 代码 的 可 读 性 


在 很 多 场合 使 用 括号 都 是 一 个 好 主意 ， 而 没 用 括号 的 话 ， 会 使 程序 得 到 错误 结果 ， 或 使 代码 
可 读 性 降低 ， 引 起 阅读 者 困惑 。 括 号 在 Python 语言 中 不 是 必须 存在 的 ， 不 过 为 了 可 读 性 ， 使 
用 括号 总 是 值得 的 。 任 何 维护 你 代码 的 人 会 感谢 你 ， 在 你 再 次 阅读 自己 的 代码 时 ， 你 也 会 感 
谢 你 自己 。 


2.5 变量 和 赋值 


Python 中 变量 名 规则 与 其 他 大 多 数 高 级 语言 一 样 ， 都 是 受 C 语 言 影响 (或 者 说 这 门 语言 本 身 就 
是 C 语 言 写成 的 ) 。 变 量 名 仅仅 是 一 些 字 母 开 头 的 标识 符 一 所谓 字 母 开 头 意 指 大 写 或 小 
写字 母 ， 另 外 还 包括 下 划 线 ( ) 。 其 他 的 字符 可 以 是 数字 、 字 母 或 下 划 线 。Python 变 量 名 是 
大 小 写 敏感 的 ， 也 就 是 说 变量 "case“ 与 “CaSe" 是 两 个 不 同 的 变量 。 





Python 有 是 动态 类 型 语言 ， 也 就 是 说 不 需要 预先 声明 变量 的 类 型 。 变 量 的 类 型 和 值 在 赋值 那 一 
刻 被 初始 化 。 变 量 赋值 通过 等 号 来 执行 。 


»»» counter = 0 

»»» miles = 1000.0 

>>> name = 'Bob' 

>>> counter = counter + 1 


>>> kilometers = 1.609 * miles 


Q 


>>> print '$f miles is the same as %f km' $ (miles, kilometers) 
1000.000000 miles is the same as 1609.000000 km 
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T > 第 四 个 是 对 一 个 整 型 增 1 , 最 后 一 个 是 浮 点 乘法 赋值 全 


Python 也 支持 增 量 赋值 ， 也 就 是 操作 符 和 等 号 合并 在 一 起 ， 看 下 面 的 例子 。 


n2n* 10 


将 上 面 的 例子 改 成 增 量 赋值 方式 就 是 : 


n *- 10 


Python 不 支持 C 语 言 中 的 自 增 1 和 自 减 1 操作 符 ， 这 是 因为 + 和 -也 是 单 目 操作 符 ，Python 会 将 -n 
解释 为 - (-n) 从 而 得 到 n， 同 样 ++n 的 结果 也 是 n。 


26 ”数字 


Python 支持 五 种 基本 数字 类 型 ， 其 中 有 三 种 是 整 型 类 型 。 


e 浮 点 值 
。 复数 


下 面 是 一 些 例子 。 


int 0101 84  -237 0x80 017 -680 -0X92 

long 29979062458L -841401 OxDECADEDEADBEEFBADFEEDDEAL 

bool True False 

float 3.14159 42E-10 —90. 6.022e23 -1.609E-19 


complex 6.23+1.5j -1.23-875J 0*1j 9.80665-8.31441J] —.0224+0j 


Python 中 有 两 种 有 趣 的 类 型 ， 就 是 Python 的 长 整 型 和 复数 类 型 。 请 不 要 将 Python 的 长 整 型 与 
C 语 言 的 长 整 型 混淆 。Python 的 长 整 型 所 能 表达 的 范围 远 远 超过 C 语 言 的 长 整 型 ， 事 实 上 ， 
Python 长 整 型 仅 受 限于 用 户 计算 机 的 虚拟 内 存 总 数 。 如 果 你 熟悉 Java,Python 的 长 整 型 类 似 于 
Java 中 的 Biglnteger 类 型 。 


从 长 远 来 看 ， 整 型 与 长 整 型 正在 逐步 统一 为 一 种 整 型 类 型 。 从 Python2.3 开 始 ， 再 也 不 会 报 整 
型 溢出 错误 ， 结 果 会 被 自动 转换 为 长 整 型 。 在 未 来 版 本 的 Python 中 ， 两 种 整 型 类 型 将 会 无 颖 
结合 ， 长 整 型 后 缀 |“ 也 会 变 得 可 有 可 无 。 

布尔 值 是 特殊 的 整 型 。 尽 管 布尔 值 由 常量 True 和 False 来 表示 ， 如 果 将 布尔 值 放 到 一 个 数值 上 
下 文 环 境 中 (比如 将 True 与 一 个 数字 相 加 ) ，True 会 被 当成 整 型 值 1, 而 False 则 会 被 当成 整 型 
值 ()。 复 数 ( 包括 -1 的 平方 根 ， 即 所 谓 的 虚数 ) 在 其 他 语言 中 通常 不 被 直接 支持 (一般 通过 类 
来 实现 ) 。 

其 实 还 有 第 6 种 数字 类 型 ， 即 decimal, 用 于 十 进 制 浮 点 型 。 不 过 它 并 不 是 内 建 类 型 ， 你 必须 先 
导入 decimal 模 块 才 可 以 使 用 这 种 数值 类 型 。 由 于 需求 日 渐 强 烈 ，Python2.4 增 加 了 这 种 类 
型 。 举 例 来 说 ， 由 于 在 二 进 制 表示 中 有 一 个 无 限 循环 片段 ， 数 字 1.1 无 法 用 二 进 制 浮 点 型 精确 
表示 。 因 此 ， 数 字 1.1 实 际 上 会 被 表示 成 如 下 形式 。 


no L.4 
1.1000000000000001 


>>> print decimal.Decimal('1l.1"') 
Lad 


第 5 章 将 详细 介绍 所 有 的 数字 类 型 。 


2.7 FAF 


Python 中 字符 串 被 定义 为 引号 之 间 的 字符 集合 。Python 支 持 使 用 成 对 的 单 引 号 或 双 引 号 ， 三 
引号 (三 个 连续 的 单 引 号 或 者 双 引 号 ) 可 以 用 来 包含 特殊 字符 。 使 用 索引 操作 符 (D 和 切片 
操作 符 ([]) 可 以 得 到 子 字符 串 。 字 符 串 有 其 特有 的 索引 规则 : 第 一 个 字符 的 索引 是 (), 最 后 一 
个 字符 的 索引 是 -1。 


加 号 (€) 用 于 字符 串 连接 运算 ， 星 号 〈*) 则 用 于 字符 串 重 复 。 下 面 是 几 个 例子 。 
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>>> pystr = 'Python' 
>>> iscool = 'is cool!' 
>>> pystr[0] 

'p' 

2555 pystr[i2:3] 

“Ener 

»»» 1scool[:Z] 

ry 

>>> iscool[3:] 

'eoelli" 

>>> iscool[-1] 

EE 

NS pystr + iscool 
'Pythonis cool!" 

>>> pyStr + ' * + lscool 
Python is cool!' 

2»» pystr * 2 
'PythonPython' 

>>> '-* * 20 
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»»» pystr = '''python 
sx AE ODL! 

>>> pystr 

'pythonMnis cool' 

>>> print pystr 
python 

1s. cool 

>>> 


你 可 以 在 第 6 章 学 到 更 多 有 关 宁 符 囊 的 知识 。 


2.8 列表 和 元 组 


可 以 将 列表 和 元 组 当成 普通 的 “数组 *"， 它 能 保存 任意 数量 任意 类 型 的 Python 对 象 。 和 数组 一 
样 ， 通 过 从 0 开始 的 数字 索引 访问 元 素 ， 但 是 列表 和 元 组 可 以 存储 不 同类 型 的 对 象 。 
列表 和 元 组 有 几 处 重要 的 区 别 。 列 表 元 素 用 中 括号 (QD) 包 衰 ， 元 素 的 个 数 及 元 素 的 值 可 以 疏 
变 。 元 组 元 素 用 小 括号 (0) 包 衷 ， 不 可 以 更 改 (尽管 他 们 的 内 容 可 以 ) 。 元 组 可 以 看 成 是 只 
读 的 列表 。 通 过 切片 运算 〈[] 和 []) 可 以 得 到 子 集 ， 这 一 点 与 字符 囊 的 使 用 方法 一 样 。 
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| 
20» ELhist 

[14 Re 3 €] 

>>>. aList[0] 


255» Abista] 

[3, 4] 

>>> aList[:3] 

[Le d 4] 

>>> aList[1] = 5 
>>> aList 

[By Dr 34, 4] 


元 组 也 可 以 进行 切片 运算 ， 得 到 的 结果 也 是 元 组 (不 能 被 修改 ) 。 


»»» aTuple = ('robots', 77, 93, 'try") 
>>> aTuple 
('robots', 77, 93, 'try') 
>>> aTuple[:3] 
('robaOts', 717, 93) 
»»» aTuple[1] = 5 
Traceback (innermost last): 
File "«stdin»", line 1, in 2 


TypeError: object doesn't support item assignment 


可 以 在 第 6 章 学 到 更 多 有 关 列 表 、 元 组 及 字符 事 的 知识 。 
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29 TX 


字典 是 Python 中 的 映射 数据 类 型 ， 工 作 原 理 类 似 Perl 中 的 关联 数组 或 哈 希 表 ， 由 键 - 值 (key- 
value) 对 构成 。 几 乎 所 有 类 型 的 Python 对 象 都 可 以 用 作 键 ， 不 过 一 般 还 是 以 数字 或 者 字符 串 
最 为 常用 。 


值 可 以 是 任意 类 型 的 Python 对 象 ， 字 典 元 素 用 大 括号 (人 }) &X- 


>>> aDict = ('host': 'earth') # create dict 
>>> aDict['port'] = 80 # add to dict 
>>> aDict 

('host': 'earth', 'port': 80) 

>>> aDict.keys() 

I'host', "port'] 

»»» aDict['host'] 

'earth' 

>>> for key in aDict: 


. print key, aDict[key] 


host earth 
port 80 


在 第 7 章 中 会 详细 讲解 字典 。 


2.10 ”代码 块 及 缩 进 对 齐 


代码 块 通过 缩 进 对 齐 表达 代码 逻辑 ， 而 不 是 使 用 大 括号 。 因 为 没有 了 额外 的 字符 ， 程 序 的 可 
读 性 更 高 。 而 且 缩 进 完全 能 够 清楚 地 表达 一 个 语句 属于 哪个 代码 块 。 当 然 ， 代 码 块 也 可 以 只 
有 一 个 语句 组 成 。 


对 一 个 Python 初学 者 来 说 ， 仅 使 用 缩 进 可 能 令 他 论 异 。 人 们 通常 间 力 避免 改变 ， 因 此 对 那些 
使 用 大 括号 很 多 年 的 人 来 说 ， 初 次 使 用 纯 缩 进来 表示 逻辑 也 许 会 多 少 感到 有 些 不 够 坚定 (不 
用 大 括号 ? 到 底 成 不 成 啊 ? ) 。 然 而 回想 一 下 ，Python 有 两 大 特性 ， 一 是 简洁 ， 二 是 可 读 性 
好 。 如 果 你 实在 讨厌 使 用 缩 进 作为 代码 分 界 ， 我 们 希望 你 从 现在 开始 ， 半 年 后 再 来 看 一 下 这 
种 方式 。 也 许 你 会 发 现 生 活 中 没有 大 括号 并 不 会 像 你 想像 的 那么 糟糕 。 


2.11 ifi& 4 


标准 if 条 件 语句 的 语法 如 下 。 


if expression: 


|f suite 
如 果 表 达 式 的 值 非 0 或 者 为 布尔 值 True, 则 代码 组 if_suite 被 执行 ; 否则 就 去 执行 下 一 条 语句 。 


代码 组 (suite) 是 一 个 Python 术 语 ， 它 由 一 条 或 多 条 语句 组 成 ， 表 示 一 个 子 代 码 块 。Python 
与 其 他 语言 不 同 ， 条件 条 达 式 并 不 需要 用 括号 括 起 来 。 


EN xw De 


print "x" must be atleast O!' 
Python 当 然 也 支持 else 语 名 ， 语 法 如 下 。 
if expression: 
if suite 
else: 


else suite 


Python 还 支持 elf ( 意 指 “else-if*) 语句 ， 语 法 如 下 。 


if expressionl: 
if suite 
elif expression2: 
elif suite 
else: 


else suite 


在 本 书写 作 之 时 ， 正 在 进行 一 个 关于 是 否 需要 增加 Switch/case 语 名 的 讨论 ， 不 过 目前 并 没有 
什么 实质 性 的 进展 。 在 将 来 版 本 的 Python 语言 当中 ， 也 非常 有 可 能 看 到 这 样 的 "动物 "。 这 个 例 
子 似乎 有 点 奇怪 、 让 人 觉得 困惑 ， 但 是 因为 有 了 Python 干净 的 语法 ，if-elif-else 语 名 并 不 像 别 
AULAS ARA GERA ( 以致 不 能 让 人 接受 ) 。 如 果 你 非 要 避免 写 一 堆 计 elif-else 语 名 ， 另 一 种 变通 
的 解决 方案 是 使 用 for 循 环 (参阅 2.13) 来 迭代 你 可 能 的 "cases“ 列 表 。 


在 第 8 章 你 可 以 学 到 更 多 有 关 if、elif 和 else 条 件 语句 的 知识 。 


2.12 ”while 循环 


标准 while 条 件 循 环 语句 的 语法 类 似 if。 再 说 一 次 ,要 使 用 缩 进 来 分 隔 每 个 子 代 码 块 。 
while expression: 


while suite 


语句 While_suite 会 被 连续 不 断 地 循环 执行 ， 直 到 表达 式 的 值 变 成 0 或 False, 接 着 Python 会 执行 
下 一 名 代码 。 类 似 放 语句，Python 的 while 语 名 中 的 条 件 表达 式 也 不 需要 用 括号 括 起 来 。 


>>> counter = 0 
>>> while counter < 3: 


$24 print 'loop f$$d' $ (counter) 
TT counter += 1 

loop #0 

loop #1 

loop #2 


While 循环 和 马上 就 要 讲 到 的 for 循 环 会 在 第 8 章 的 关于 循环 的 小 节 进 行 详细 讲解 。 


2.13 for 循环 和 range() 内 建 函 数 


Python 中 的 for 循 环 与 传统 的 for 循 环 (计数 器 ee 
代 。 Python P fork k TARIR (例如 序列 或 迭代 器 ) 作为 其 参数 ， 每 次 迭代 其 中 一 个 元 
* o 


>>> print 'I like to use the Internet for:' 

I like to use the Internet for: 

>>> for item in ['e-mail', 'net-surfing', 'homework', 
"chat" ]: 


print item 


e-mail 
net-surfing 
homework 
chat 


上 面 例子 的 输出 如 果 能 在 同一 行 就 会 美观 许多 。print 语 多 默认 会 给 每 一 行 添加 一 个 换行 符 。 
只 要 在 print 语 句 的 最 后 添加 一 个 各 号 (，) ， 就 可 以 改变 它 这 种 行为 。 


print 'I like to use the Internet for:' 
for item in ['e-mail', 'net-surfing', 'homework', 'chat']: 
print item, 


print 


上 面 的 代码 还 添加 了 一 个 额外 的 没有 任何 参数 的 print 语 句 ， 它 用 来 输出 一 个 换行 符 。 否 则 ， 
提示 信息 就 会 立刻 出 现在 我 们 的 输出 之 后 。 下 面 是 以 上 代码 的 输出 。 


I like to use the Internet for: 
e-mail net-surfing homework chat 


为 了 输出 清晰 美观 ， 带 各 号 的 print 语 句 输 出 的 元 素 之 问 会 自动 添加 一 个 空格 。 通 过 指定 输出 
格式 ， 程 序 员 可 以 最 大 程度 地 控制 输出 布局 ， 也 不 用 担心 这 些 自动 添加 的 空格 。 它 也 可 以 将 





所 有 数据 放 到 一 处 输出 只 需要 将 数据 放 在 格式 化 操作 符 右 侧 的 元 组 或 字典 中 。 
>>> who = 'knights' 
>>> what = 'Ni!' 


>>> print 'We are the', who, 'who say', what, what, what, what 
We are the knights who say Ni! Ni! Ni! Ni! 
>>> print 'We are the $s who say $s' $ \ 

(who, ((what + ' ') * 4)) 


We are the knights who say Ni! Ni! Ni! Ni! 


使 用 字符 串 格式 操作 符 还 允许 我 们 做 一 些 字符 串 输出 之 前 的 整理 工作 ， 就 像 你 在 刚才 的 例子 
中 看 到 的 一 样 。 


通过 演示 一 个 让 Python for 循 环 更 像 传统 循环 (换言之 ， 计 数 循环 ) 的 示例 ， 我 们 来 结束 对 特 
环 的 介绍 。 因 为 我 们 不 能 改变 for 循 环 的 行为 〈( 选 代 一 个 序列 ) ， 我 们 可 以 生成 一 个 数字 序 
列 。 这 样 ， 尽 管 我 们 确实 是 在 选 代 一 个 序列 ， 但 是 它 至 少 展示 的 是 递增 计数 的 效果 。 


>>> for eachNum in iU; l1, žilo 


TT print eachNum 
0 
l 
2 


在 这 个 循环 中 ，eachNum 包 含 的 整 型 值 可 以 用 于 显示 ， 也 可 以 用 于 计算 。 因 为 我 们 要 使 用 的 
数值 范围 可 能 会 经 常 变化 ，Python 提 供 了 一 个 range() 内 建 函 数 来 生成 这 种 列表 。 它 正好 能 满 
足 我 们 的 需要 ， 接 受 一 个 数值 范围 ， 生 成 一 个 列表 。 


>>> for eachNum in range(3): 


print eachNum 


l 
2 


对 字符 串 来 说 ， 很 容易 选 代 每 一 个 字符 。 


>>> foo = 'abc' 


>>> for c in foo: 


range() R% 2£ *$ felen() i 2 — e FE] T- EAE B RS] o de RC AIT LET ASARAK 
值 。 


>>> foo = 'abc' 


>>> for i in range(len(foo)): 


— print foo[i], (3d) *$ i 
a (0) 
Bm rr 
$ UI 


不 过 ， 这 些 循 环 有 一 个 约束 ， 你 要 么 循环 索引 ， 要 么 循环 元 素 。 这 寻 致 了 enumerate() 函 数 的 
推出 《Python2.3 新 增 ) 。 它 同时 做 到 了 这 两 点 。 

>>> for i, ch in enumerate(foo): 

— print eh, '($0)' * 1 

a (0) 

b (1) 

c (2) 


2.14 列表 解析 
这 是 一 个 让 人 欣喜 的 术语 ， 表 示 你 可 以 在 一 行 中 使 用 一 个 for 循 环 将 所 有 值 放 到 一 个 列表 当 
中 : 

>>> squared = [x ** 2 for x in range(4)] 


>>> for i in squared: 


print i 


O ou Pe O 


列表 解析 甚至 能 做 更 复杂 的 事情 ， 比 如 挑选 出 符合 要 求 的 值 放 入 列表 。 


>>> sqdEvens = [x ** 2 for x in range(8) if not x $ 2] 
>>> 
>>> for i in sqdEvens: 


print i 


2.15 x fFfe A s Zt open() ` file() 


在 你 已 经 习惯 一 门 语言 的 语法 之 后 ， 文 件 访 问 是 相当 重要 的 一 环 。 在 一 些 工作 做 完 之 后 ， 将 
它 保存 到 持久 存储 是 很 重要 的 。 


如 何 打 开 文 件 
handle = open(file name, access mode = 'r') 


file_name 变 量 包含 我 们 希望 打开 的 文件 的 字符 串 名 字 ，access_mode 中 Y 表 示 读 取 ，'Ww' 表 示 
写 入 ，'a' 表 示 添加 。 其 他 可 能 用 到 的 标识 还 有 '+' 表 示 读 写 ，'b' 表 示 二 进 制 访问 。 如 果 未 提供 
access_mode, 默 认 值 为 内。 如 果 open() 成 功 ， 一 个 文件 对 象 句柄 会 被 返回 。 所 有 后 续 的 文件 
操作 都 必须 通 和 此 文件 句柄 进行 。 AAA (di 我 们 就 可 以 访问 它 的 一 些 方法 ， 
比如 readlines() 和 close()。 文 件 对 象 的 方法 属性 也 必须 通过 句点 属性 标识 法 访问 (参阅 下 面 的 
核心 笔记 ) 。 


核心 笔记 : 什么 是 属性 ? 


属性 是 与 数据 有 关 的 项 目 。 属 性 可 以 是 简单 的 数据 值 ， 也 可 以 是 可 执行 对 象 ， 比 如 函数 和 方 
法 。 哪 些 对 象 拥 有 属性 呢 ? 很 多 。 类 、 模 块 、 文 件 和 复数 等 对 象 都 拥有 属性 。 我 如 何 访 问 对 
象 属 性 ?使 用 名 点 属性 标识 法 。 也 就 是 说 在 对 象 名 和 属性 名 之 间 加 一 个 名 点 (.) 
object.attribute ° 


下 面 有 一 些 代 码 ， 提 示 用 户 输入 文件 名 ， 然 后 打开 一 个 文件 ， 并 显示 它 的 内 容 到 屏幕 上 。 


filename = raw input('Enter file name: ') 
fobj = open(filename, 'r') 
for eachLine in fobj: 

print eachLine, 
fobj.close() 
我 们 的 代码 没有 用 循环 一 次 取 一 行 显示 ， 而 是 做 了 点 改变 。 我 们 一 次 读 入 文件 地 所 有 行 ， 然 
后 关闭 文件 ， 再 迭代 每 一 行 输出 。 这 样 写 代码 的 好 处 是 能 够 快速 完整 地 访问 文件 。 内 容 输出 
和 文件 访问 不 必 交 替 进 行 。 这 样 代 码 更 清晰 ， 而 且 将 不 相关 的 任务 区 分 开 来 。 需 要 注意 的 一 
点 是 文件 的 大 小 。 上 面 的 代码 适用 于 文件 大 小 适中 的 文件 。 对 于 很 大 的 文件 来 说 ， 上 面 的 代 
码 会 占用 太 多 的 内 存 ， 这 时 你 最 好 一 次 读 一 行 (下 一 节 有 一 个 好 例子 ) 。 
我 们 的 代码 中 另 一 个 有 趣 的 语句 是 我 们 又 一 次 在 print 语 句 中 使 用 逗号 来 抑制 自动 生成 的 换行 
符号 。 为 什么 要 这 样 做 ? 因为 文件 中 的 每 行文 本 已 经 自 带 了 换行 字符 ， 如 果 我 们 不 抑制 print 
语句 产生 的 换行 符号 ， 文 本 在 显示 时 就 会 有 额外 的 空 行 产生 。 
file() 内 建 函 数 是 最 近 才 添加 到 Python 当中 的 。 它 的 功能 等 同 于 open()， 不 过 file() 这 个 名 字 可 以 
更 确切 地 表明 它 是 一 个 工厂 函数 〈《 生 成 文件 对 象 ) 。 类 似 于 intO 生 成 整 型 对 象 ，dictO 生 成 字 
典 对 象 。 在 第 9 章 ， 我 们 将 详细 介绍 文件 对 象 和 它们 的 内 建 方法 属性 ， 以 及 如 何 访问 本 地 文件 
系统 。 请 参考 第 9 章 以 了 解 详细 信息 。 


2.16 4 iX 4-4 
编译 时 会 检查 语法 错误 ， 不 过 Python 也 允许 在 程序 运行 时 检测 错误 。 当 检测 到 一 个 错误 ， 
Python 解释 器 就 引发 一 个 异常 ， 并 显示 异 常 的 详细 信息 。 程 序 员 可 以 根据 这 些 信息 迅速 定位 
问题 并 进行 调试 ， 并 找 出 处 理 错误 的 办 法 。 
要 给 你 的 代码 添加 错误 检测 及 异常 处 理 ， 只 要 将 它们 "封装 "在 try-except 语 名 当中 otry 之 后 的 代 
码 组 ， 就 是 你 打算 管理 的 代码 oexcept 之 后 的 代码 组 ， 则 是 你 处 理 错误 的 代码 。 
try: 

filename = raw input('Enter file name: ') 


fobj = open (filename, 'r') 


for eachLine in fobj: 
print eachLine, 
fobj.close() 
except IOError, e: 


print 'file open error:', e 


程序 员 也 可 以 通过 使 用 raise 语 名 故意 引发 一 个 异常 。 在 第 10 章 你 可 以 学 到 更 多 有 关 Python 异 
常 的 知识 。 
2.17 AŽ 


类 似 于 其 他 语言 ，Python 中 的 函数 使 用 小 括号 〈()) 3878 o S8 CAE TA FE] ZW ob A IE Lo de 
E XT AA retumi& 4] » 3t e E sr 3x wNone*t €. » 


Python 是 通过 引用 调用 的 。 这 意味 着 函数 内 对 参数 的 改变 会 影响 到 原始 对 象 。 不 过 事实 上 只 
有 可 变 对 象 会 受 此 影响 ， 对 不 可 变 对 象 来 说 ， 它 的 行为 类 似 按 值 调用 。 
2.17.1 如 何 定 义 有 函数 
def function name([arguments]): 
"optional documentation string" 
function suite 
定义 一 个 函数 的 语法 由 def 关 键 字 及 紧 随 其 后 的 函数 名 ， 再 加 上 该 函数 需要 的 几 个 参数 组 成 。 
函数 参数 (比较 上 面 例子 中 的 arguments) 是 可 选 的 ， 这 也 是 为 什么 把 它们 放 到 中 括号 中 的 原 


。 《在 你 的 代码 里 千 万 别 写 上 中 括号 6) 这 个 语句 由 一 个 冒号 (:) 结 来 (与 ff 和 while 语 种 
的 结束 方式 一 样 ) ， 之 后 是 代表 函数 体 的 代码 组 ， 下 面 是 一 个 简短 的 例子 。 


def addMe2Me (x): 


'apply + operation to argument' 


return (x + x) 


这 个 函数 ， 做 的 是 “在 我 的 值 上 加 我 "的 工作 。 它 接受 一 个 对 象 ， 将 它 的 值 加 到 自身 ， 然 后 返回 
和 。 对 于 数值 类 型 参数 ， 它 的 结果 是 显而易见 的 ， 不 过 我 要 在 这 里 指出 ， 加 号 操作 符 几 乎 与 
所 有 数据 类 型 工作 。 换 和 句 话 说 ， 几 乎 所 有 的 标准 数据 类 型 都 支持 + 操作 符 ， 不 管 是 数值 相 加 还 
是 序列 合并 。 
2.17.2 ”如 何 调用 函数 

>>> addMe2Me (4.25) 

B. 

"e 

>>> addMe2Me (10) 

20 

SO 

>>> addMe2Me('Python') 

'PythonPython' 

>>> 

>>> addMe2Me([-1, 'abc']) 

I1, "ape"; =L; 'aábc'] 
Python 语言 中 调用 有 函数 与 在 其 他 高 级 语言 中 一 样 ， 为 函数 名 加 上 函数 操作 符 一 对 小 括 


号 。 括 号 之 间 是 所 有 可 选 的 参数 。 即 使 一 个 参数 也 没有 ， 人 小 括号 也 不 能 省 略 。 注 意 一 下 ，+ 操 
作 符 在 非 数 值 类 型 中 如 何 工作 。 





2.17.3 ”默认 参数 


函数 的 参数 可 以 有 一 个 黑 认 值 ， 如 果 提 供 有 默认 值 ， 在 函数 定义 中 ， 参 数 以 赋值 语句 的 形式 
提供 。 事 实 上 这 仅仅 是 提供 默认 参数 的 语法 ， 它 表示 函数 调用 时 如 果 没 有 提供 这 个 参数 ， 它 
就 取 这 个 值 作 为 默认 值 。 
>>> def foo(debug-True): 
'determine if in debug mode with default argument ' 
if debug: 
print 'in debug mode' 


print 'done' 


>>> foo() 

in debug mode 
done 

>>> foo(False) 


done 


在 上 面 的 例子 里 ，debug 参 数 有 一 个 默认 值 True。 如 果 我 们 没有 传递 参数 给 函数 foo(), debug 
自动 拿 到 一 个 值 True。 在 第 二 次 调用 foo() 时 ， 我 们 故意 传递 一 个 参数 False 给 foo(), 这 样 ， 默 认 
参数 就 没有 被 使 有 用。 部 数 拥有 的 特性 远 比 我 们 在 这 里 介绍 的 多 ， 请 阅读 第 11 章 以 了 解 更 详细 
的 函数 的 信息 。 


2.18 X 


是 面向 对 象 编程 的 核心 ， 它 扮演 相关 数据 及 逻辑 容器 的 角色 。 它 们 提供 了 创建 芮 实 "对 象 ( 也 
就 是 实例 ) 的 蓝图 。 因 为 Python 并 不 强求 你 以 面向 对 象 的 方式 编程 (与 Java 不 同 ) ， 此 刻 你 
也 可 以 不 学 习 类 。 不 过 我 们 还 是 在 这 儿 放 了 些 例 子 ， 以 方便 感 兴趣 的 读者 浏览 。 


如 何 定义 类 

class ClassName (base class[es]): 
"Optional documentation string" 
static member declarations 


method declarations 


使 用 class 关 键 字 定义 类 。 可 以 提供 一 个 可 选 的 父 类 或 者 说 基 类 ; 如 果 没 有 合适 的 基 类 ， 那 就 
使 用 object 作 为 基 类 。class 行 之 后 是 可 选 的 文档 字符 串 、 静 态 成 员 定 义 及 方法 定义 。 


class FooClass (object): 


"""my very first class: FooClass 


version = 0.1 # class (data) attribute 


def init (self, nm-'John Doe'): 


"nw" "nn 


constructor 
self.name = nm # class instance (data) attribute 
print 'Created a class instance for', nm 
def showname (self): 
"""display instance attribute and class name""" 
print 'Your name is', self.name 
print 'My name is', self. class . name 
def showver(self): 
"""display class(static) attribute""" 
print self.version & references FooClass.version 
def addMe2Me(self, x): * does not use 'self' 
"""apply * operation to argument""" 


return x * x 


在 上 面 这 个 类 中 ， 我 们 定义 了 一 个 静态 变量 Version, 它 将 被 所 有 实例 及 4 个 方法 共享 一 一 
. init (). showname()、showver() 及 熟悉 的 addMe2Me()。 这 些 show*() 方 法 并 没有 做 什么 有 
用 的 事情 ， 仅 仅 输 出 对 应 的 信息 。 nit _() 方 法 有 一 个 特殊 名 字 ， 所 有 名 字 开 始 和 结束 都 有 
两 个 下 划 线 的 方法 都 是 特殊 方法 。 
当 一 个 类 实例 被 创建 时 ，_init _() 方 法 会 自动 执行 ,在 类 实例 创建 完毕 后 执行 ,类 似 构造 器 。 
O Mt _() 可 以 被 当成 构造 器 ， 不 过 不 像 其 他 语言 中 的 构造 器 ， 它 并 不 创建 实例 一 一 它 仅仅 是 
你 的 对 象 创 建 后 执行 的 第 一 个 方法 。 它 的 目的 是 执行 一 些 该 对 象 的 必要 的 初始 化 工作 。 通 过 
创建 自己 的 _init (方法 ， 你 可 以 覆盖 默认 的 _init _() 方 法 〈 默 认 的 方法 什么 也 不 做 ) >M 
而 能 够 修饰 刚刚 创建 的 对 象 。 在 这 个 例子 里 ， 我 们 初始 化 了 一 个 名 为 name 的 类 实例 属性 (或 
者 说 成 员 ) 。 这 个 变量 仅 在 类 实例 中 存在 ， 它 并 不 是 实际 类 本 身 的 一 部 分 。__init _() 需 要 一 
个 默认 的 参数 ， 前 一 节 中 曾经 介绍 过 。 毫 无 疑问 ， 你 也 注意 到 每 个 方法 都 有 的 一 个 参数 ， 
self ° 
什么 是 self? 它 是 类 实例 自身 的 引用 。 其 他 面向 对 象 语言 通常 使 用 一 个 名 为 this 的 标识 符 。 
如 何 创建 类 实例 

>>> fool = FooClass() 


Created a class instance for John Doe 


屏幕 上 显示 的 字符 串 正 是 自动 调用 _init () 方 法 的 结果 。 当 一 个 实例 被 创建 ， init 082 
被 自动 调用 ， 不 管 这 个 init () 是 自 定义 的 还 是 默认 的 。 


创建 一 个 类 实例 就 像 调用 一 个 函数 ， 它 们 确实 拥有 一 样 的 语法 ， 它 们 都 是 可 调用 对 象 。 类 实 
例 使 用 同样 的 函数 操作 符 调用 一 个 函数 或 方法 。 既 然 我 们 成 功 创建 了 第 一 个 类 实例 ， 那 现在 
来 进行 一 些 方法 调用 。 


>>> fool.showname () 

Your name is John Doe 

My name is main .FooClass 
>>> 

>>> fool.showver() 

0.1 

>>> print fool.addMe2Me(5) 

10 

>>> print fool.addMe2Me('xyz') 


XyZXyZz 


每 个 方法 的 调用 都 返回 我 们 期 望 的 结果 。 比 较 有 趣 的 数据 是 类 名 字 。 在 showname() 方 法 中 ， 
我 们 显示 self，_ class . name 变量 的 值 。 对 一 个 实例 来 说 ， 这 个 变量 表示 实例 化 它 的 类 
的 名 字 (self class 引用 实际 的 类 ) 。 在 我 们 的 例子 里 ， 创 建 类 实例 时 我 们 并 未 传递 名 字 
参数 ， 因 此 默认 参数 'John Doe’ 就 被 自动 使 用 。 在 我 们 下 一 个 例子 里 ， 我 们 将 指定 一 个 参数 。 


>>> foo2 = FooClass('Jane Smith') 
Created a class instance for Jane Smith 
>>> foo2.showname () 

Your name is Jane Smith 


My name is FooClass 


第 13 章 将 详细 介绍 Python 类 和 类 实例 。 


2.19 ”模块 


模块 是 一 种 组 织 形 式 ， 它 将 彼此 有 关系 的 Python 代码 组 织 到 一 个 个 独立 文件 当中 。 模 块 可 以 
包含 可 执行 代码 、 部 数 和 类 ， 或 者 这 些 东 西 的 组 合 。 


当 你 创建 了 一 个 Python 源 文件 ， 模 块 的 名 字 就 是 不 带 .py 后 级 的 文件 名 。 一 个 模块 创建 之 后 ， 
你 可 以 从 另 一 个 模块 中 使 用 import 语 句 导 入 这 个 模块 来 使 用 。 


2.19.1 如 何 导 入 模块 


import module name 


2.19.2 ”如 何 访问 一 个 模块 函数 或 访问 一 个 模块 变量 


一 旦 导入 完成 ， 一 个 模块 的 属性 《函数 和 变量 ) 可 以 通过 熟悉 的 句点 属性 标识 法 访问 。 


module.function() 


module.variable 


现在 我 们 再 次 提供 Hello World! 例 子 ， 不 过 这 次 使 用 Sys 模块 中 的 输出 函数 。 


22» import sys 

>>> sys.stdout.write('Hello World!n') 

Hello World! 

>>> sys.platform 

'win32' 

>>> SyS.version 

'2.4.2 (#67, Sep 28 2005, 10:51:12) [MSC v.1310 32 bit 
(Intel)]' 


这 些 代码 的 输出 与 我 们 使 用 print 语 多 完全 相同 。 唯 一 的 区 别 在 于 这 次 调用 了 标准 输出 的 write() 
方法 ， 而 且 这 次 需要 显 式 地 在 字符 串 中 提供 换行 字符 。 不 同 于 print 语 句 ，write() 不 会 自动 在 字 
符 囊 后 面 添加 换行 符号 。 


关于 模块 和 导入 ， 你 可 以 在 第 12 章 中 得 到 更 多 有 用 的 信息 。 在 那里 会 详细 介绍 本 章 上 面 所 有 
提 到 的 主题 ， 布 望 我 们 提供 的 快速 入 门 能 达到 帮助 你 迅速 使 用 Python 开始 工作 的 目标 。 


J 


核心 笔记 : 什么 是 ‘PEP” 


在 本 书 中 你 会 经 常 看 到 PEP 这 个 字眼 。 一 个 PEP 就 是 一 个 Python 增强 提案 (Python 
Enhancement Proposal) ， 这 也 是 在 新 版 Python 中 增加 新 特性 的 方式 。 从 初学 者 的 角度 看 ， 
它们 是 一 些 高 级 读物 ， 不 但 提供 了 新 特性 的 完整 描述 ， 还 有 添加 这 些 新 特性 的 理由 ， 如 果 需 
要 的 话 ， 还 会 提供 新 的 语法 、 技 术 实 现 细节 、 向 后 兼容 信息 等 。 在 一 个 新 特性 被 整合 进 
Python 之 前 ， 必 须 通 过 Python 开 发 社区 、PEP 作 者 及 实现 者 ， 还 有 Python 的 创始 人 Guido van 
Rossum 的 一 致 同意 。PEP1 阐 述 了 PEP 的 目标 及 书写 指南 。 在 PEP0 中 可 以 找到 所 有 的 PEP。 
PEP & 51 & M 3E X http:;//python.org/dev/peps ° 


2.20 实用 的 函数 


本 章 中 ， 我 们 用 到 了 很 多 实用 的 内 建 函 数 。 表 2.1 中 总 结 了 这 些 函 数 ， 并 且 提 供 了 一 些 其 他 的 
有 用 函数 〈 注 意 我 们 并 没有 提供 完整 的 使 用 语法 ， 仅 提供 了 我 们 认为 可 能 对 你 有 用 的 部 
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4241 对 新 Python 程序 员 有 用 的 内 建 函数 
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2.21 练习 


2-1. 变 量 ，print 和 字符 串 格式 化 操作 符 。 启 动 交互 式 解 释 器 ， 给 一 些 变量 赋值 (字符 囊 ， 
数值 等 ) 并 通过 输入 变量 名 显示 它们 的 值 。 再 用 print 语 多 做 同样 的 事 。 这 二 者 有 何 区 
别 ? 也 尝试 着 使 用 字符 囊 格式 操作 符 %， 多 做 几 次 ， 慢 慢 熟 入 它 。 


2-2. 程 序 输出 。 阅 读 下 面 的 Python 脚本 。 


Python 核心 编程 第 二 版 


#!/usr/bin/env python 
1l "2*4 


(a) 你 认为 这 段 脚 本 是 用 来 做 什么 的 ? 
(b) 你 认为 这 段 脚本 会 输出 什么 


(c) 输入 以 上 代码 ， 并 保存 为 脚本 ， 然 后 运行 它 。 它 所 做 的 与 你 的 预期 一 样 吗 ? 为 
什么 一 样 不 一 样 ? 


(d) 这 段 代码 单独 执行 和 在 交互 解释 器 中 执行 有 何不 同 ? 试 一 下 ， 然 后 写 出 结果 。 
(e) 如 何 改进 这 个 脚本 ， 以 便 它 能 和 你 想像 的 一 样 工 作 ? 


2-3. 数 值 和 操作 符 。 启 动 交互 解释 器 ， 使 用 Python 对 两 个 数值 (任意 类 型 ) 进行 加 、 


减 、 乘 、 除 运算 。 然 后 使 用 取 余 操 作 符 来 得 到 两 个 数 相 除 的 余数 ， 最 后 使 用 乘 方 操作 符 


ROM pO o 
2-4. 使 用 raw_input() 函 数 得 到 用 户 输入 。 


(a) 创建 一 段 脚 本 使 用 raw_input() 内 建 函 数 从 用 户 输入 得 到 一 个 字符 囊 ， 然 后 显示 
这 个 用 户 刚刚 键入 的 字符 串 。 


(b) 添加 一 段 类 似 的 代码 ， 不 过 这 次 输入 的 是 数值 。 将 输入 数据 转换 为 一 个 数值 对 
象 ，( 使 用 int() 或 其 他 数值 转换 函数 ) 并 将 这 个 值 显示 给 用 户 看 ( 注意， 如果 你 用 
的 是 早 于 1.5 的 版 本 ， 你 需要 使 用 stririg.ato*() 函 数 执行 这 种 转换 ) o 


2-5. 循 环 和 数字 。 
分 别 使 用 while 和 for 创 建 一 个 循环 。 


(a) 写 一 个 while 循 环 ， 输 出 整 型 为 0 一 10 (要 确保 是 0 一 10, 而 不 是 D~9 或 1~ 
10) 。 


(b) 做 同 (a) 一 样 的 事 ， 不 过 这 次 使 用 range() 内 建 函 数 。 


2-6. 条 件 判 断 。 判 断 一 个 数 是 正 数 ， 还 是 负数 ， 或 者 是 0。 开 始 先 用 固定 的 数值 ， 然 后 修 


改 你 的 代码 支持 用 户 输入 数值 再 进行 判断 。 


2-7. 循 环 和 字 串 。 从 用 户 那里 接受 一 个 字符 串 输 入 ， 然 后 逐 字 符 显示 该 字符 串 。 先 用 
while 循 环 实现 ， 然 后 再 用 for 循 环 实现 。 


2-8. 循 环 和 操作 符 。 创 建 一 个 包含 五 个 固定 数值 的 列表 或 元 组 ， 输 出 他 们 的 和 。 然 后 修改 


你 的 代码 为 接受 用 户 输 入 数值 。 分 别 使 用 while 和 for 循 环 实现 。 
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2-9. 循 环 和 操作 符 。 创 建 一 个 包含 五 个 国定 数值 的 列表 或 元 组 ， 输 出 他 们 的 平均 值 。 本 练 
习 的 难点 之 一 是 通过 除法 得 到 平均 值 。 你 会 发 现 整 型 除 会 截 去 小 数 ， 因 此 你 必须 使 用 浮 
点 除 以 得 到 更 精确 的 结果 。float() 内 建 函 数 可 以 帮助 你 实现 这 一 功能 。 


2-10. 带 循环 和 条 件 判断 的 用 户 输入 。 使 用 raw_input0 函 数 来 提示 用 户 输入 一 个 1 和 100 之 
间 的 数 ， 如 果 用 户 输入 的 数 满足 这 个 条 件 ， 显 示 成 功 并 退出 。 和 否则 显示 一 个 错误 信息 然 
后 再 次 提示 用 户 输入 数值 ， 直 到 满足 条 件 为 止 。 


2-11. 带 文本 菜单 的 程序 写 一 个 带 文本 菜单 的 程序 ， 菜 单项 如 下 : (1) 取 五 个 数 的 和 ; 
(2) 取 五 个 数 的 平均 值 ... (X) 退出 。 由 用 户 做 一 个 选择 ， 然 后 执行 相应 的 功能 。 当 用 
户 选择 退出 时 程序 结束 。 这 个 程序 的 有 用 之 处 在 于 用 户 在 功能 之 间 切 换 不 需要 一 遍 一 遍 
地 重新 启动 你 的 脚本 (这 对 开发 人 员 测 试 自己 的 程序 也 会 大 有 用 处 ) 。 


2-12.dir() 内 建 函 数 。 


(a) 启动 Python 交互 式 解 释 器 ， 通 过 直接 键入 dir() 回 车 以 执行 dir() 内 建 函 数 。 你 看 
到 什么 ? 显示 你 看 到 的 每 一 个 列表 元 素 的 值 ， 记 下 实际 值 和 你 想像 的 值 。 


(b) 你 会 间 ，dir() 却 数 是 干什么 的 ? 我 们 已 经 知道 在 dir 后 边 加 上 一 对 括号 可 以 执行 
dir() 内 建 函 数 ， 如 果 不 加 括号 会 如 何 ? 试 一 试 。 解 释 器 返回 给 你 什么 信息 ? 你 认为 
这 个 信息 表示 什么 意思 ? 


(c) type() 内 建 函 数 接收 任意 的 Python 对 象 作为 参数 并 返回 他 们 的 类 型 。 在 解释 器 
中 键入 type (dir) ,看 看 你 得 到 的 是 什么 ? 


(d) 本 练习 的 最 后 一 部 分 ， 我 们 来 瞧 一 瞧 Python 的 文档 字符 串 。 通 过 dir doc — 
可 以 访问 dir() 内 建 函 数 的 文档 字符 串 。print di. doc “可 以 显示 这 个 字符 串 的 内 
容 。 许 多 内 建 函 数 、 方 法 、 模 块 及 模块 属性 都 有 相应 的 文档 字符 囊 。 我 们 希望 你 在 
你 的 代码 中 也 要 书写 文档 字符 串 ， 它 会 对 使 用 这 些 代码 的 人 提供 及 时 方便 的 帮助 。 


2-13. 利 用 dir() 找 出 Sys 模块 中 更 多 的 东西 。 


(a) 启动 Python 交 互 解释 器 ， 执 行 dir() 驾 数 ， 然 后 键入 import sys 以 导入 sys 模 块 。 
再 次 执行 dir() 辑 数 以 确认 sys 模块 被 正确 的 导入 。 然 后 执行 dir (sys) ,你 就 可 以 看 到 
sys 模 块 的 所 有 属性 了 。 


(b) 显示 sys 模块 的 版 本 号 属性 及 平台 变量 。 记 住 在 属性 名 前 一 定 要 加 Sys., 这 表示 
这 个 属性 是 sySs 模 块 的 。 其 中 version 变 量 保存 着 你 使 用 的 Python 解释 器 版 本 ， 
platform 属 性 则 包含 你 运行 Python 时 使 用 的 计算 机 平台 信息 。 


(c) 最 后 ， 调 用 sys.exit() 亟 数 。 这 是 一 种 热 键 之 外 的 另 一 种 退出 Python 解 释 器 的 方 
式 。 


2-14. 操 作 符 优先 级 和 括号 分 组 。 重 写 2.4 小 节 中 print 语 句 里 的 算术 表达 式 ， 试 着 在 这 个 表 
达 式 中 添加 合适 的 括号 以 便 它 能 正常 工作 。 
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2-15. 元 素 排序 。 


让 用 户 输 入 3 个 数值 并 将 分 别 将 它们 保存 到 3 个 不 同 的 变量 中 。 不 使 用 列表 或 排序 算 
法 ,自己 写 代码 来 对 3 个 数 由 小 到 大 排序 。 (b) 修改 (a) 的 解决 方案 ， 使 之 从 大 到 
小 排序 。 


2-16. 文 件 。 键 入 2.15 节 的 文件 显示 的 代码 ， 然 后 运行 它 ， 看 看 能 否 在 你 的 系统 上 正常 工 
作 ， 然 后 试 一 下 其 他 的 输入 文件 。 
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$33 ”Python 基础 


本 章 主 题 

€ 语句 和 语法 

e 变量 赋值 

4 基本 风格 指南 

e 内 存 管理 

+ 第 一 个 Python 程序 


我 们 下 一 个 目标 是 了 解 基本 的 Python 语法 ， 介 绍 一 些 基本 的 编程 风格 ， 之 后 简要 介绍 一 下 标 
识 符 、 变 量 和 关键 字 。 我 们 也 会 讨论 变量 占用 的 内 存 是 如 何 分 配 和 回收 的 。 最 后 ， 我 们 会 给 
出 一 个 较 大 的 Python 样 例 程序 ， 让 你 实际 体验 一 下 这 些 特性 。 不 必 担 心 ， 在 你 畅游 Python 的 
过 程 中 有 很 多 救生 员 在 保护 着 你 。 


3.1 语句 和 语法 


Python 语 句 中 有 一 些 基本 规则 和 特殊 字符 : 
e 并 号 (4) 表示 之 后 的 字符 为 Python 注释 ; 
e 换行 (n) 是 标准 的 行 分 隔 符 (通常 一 个 语句 一 行 ) 
e RA (\) 继续 上 一 行 ; 
e 分 号 (;) 将 两 个 语句 连接 在 一 行 中 ; 
e HX (:) 将 代码 块 的 头 和 体 分 开 ; 
e 语句 (RER) 用 缩 进 块 的 方式 体现 ; 
e 不 同 的 缩 进深 度 分 隔 不 同 的 代码 块 ; 
e Python 文件 以 模块 的 形式 组 织 。 
3.1.1 注释 (#) 
首要 说 明 的 事情 是 : 尽管 Python 是 可 读 性 最 好 的 语言 之 一 ， 这 并 不 意味 着 程序 员 在 代码 中 就 


可 以 不 写 注释 。 和 很 多 Unix 脚 本 类 似 ，Python 注 释 语 钨 从 # 字 符 开 始 ， 注 释 可 以 在 一 行 的 任何 
地 方 开始 ， 解 释 器 会 忽略 掉 该 行 # 之 后 的 所 有 内 容 。 要 正确 地 使 用 注释 。 


3.1.2 继续 (V) 
Python 语句 ， 一 般 使 用 换行 分 隔 ， 也 就 是 说 一 行 一 个 语 负 。 一 行 过 长 的 语句 可 以 使 用 反 斜 杠 
(\) 分 解 成 几 行 ， 如 下 例 。 
# check conditions 
if (weather is hot == 1) and \ 
(shark warnings -- 0): 


send goto beach mesg to pager() 


A URS IHE DU AE ETUR TLLA BUILD VU T o AIEA MARERE o XE MHBADTXUR 
多 行 ， 例 如 : 在 含有 小 括号 、 中 括号 、 花 括号 时 可 以 多 行书 写 。 另 外 就 是 三 引号 包括 下 的 字 
符 串 也 可 以 跨行 书写 ， 如 下 例 。 


显示 一 个 三 引号 字符 囊 


print '''hi there, this is a long message for you 
that goes over multiple lines... you will find 
out soon that triple quotes in Python allows 


this kind of fun! it is like a day on the beach!''"' 


xo gd 
给 一 些 变 量 赋值 
go surf, get a tan while, boat size, toll money = (1, 
'windsurfing', 40.0, -2.00) 
如 果 要 在 使 用 反 斜 线 换行 和 使 用 括号 元 素 换 行 两 者 之 间作 一 个 选择 ， 我 们 推荐 使 用 括号 ， 这 
样 可 读 性 会 更 好 。 
3.1.3 ”多 个 语句 构成 代码 组 (:) 


缩 进 相同 的 一 组 语句 构成 一 个 代码 块 ， 我 们 称 之 为 代码 组 。 像 f、while、def 和 class 这 样 的 复 
合 语 句 ， 首 行 以 关键 字 开 始 ， 以 冒号 C) 结束 ， 该 行 之 后 的 一 行 或 多 行 代码 构成 代码 组 。 我 
们 将 首 行 及 后 面 的 代码 组 称 为 一 个 子 名 (clause) 。 


3.1.4. ”代码 组 由 不 同 的 缩 进 分 隔 


我 们 在 2.10 一 节 中 曾 提 到 ，Python 使 用 缩 进来 分 隔 代码 组 。 代 码 的 层次 关系 是 通过 同样 深度 
的 空格 或 制 表 符 缩 进 体现 的 。 同 一 代码 组 的 代码 行 必 须 严格 左 对 齐 (左边 有 同样 多 的 空格 或 
同样 多 的 制 表 符 ) ， 如 果 不 严 格 遵守 这 个 规则 ， 同 一 组 的 代码 就 可 能 被 当成 另 一 个 组 ， 甚 至 
会 导致 语法 错误 。 





核心 风格 : 缩 进 4 个 空格 宽度 ， 避 免 使 用 制 表 符 


对 一 个 初次 使 用 空白 字符 作为 代码 块 分 界 的 人 来 说 ， 遇 到 的 第 一 个 问题 是 ， 缩 进 多 大 宽度 才 
合适 ?2 个 太 少 ，6~8 个 又 太 多 ， 因 此 我 们 推荐 使 用 4 个 空格 宽度 。 需 要 说 明 一 点 ， 不 同 的 文本 
编辑 器 中 制 表 符 代表 的 空白 宽度 不 一 ， 如 果 你 的 代码 要 跨 平 台 应 用 ， 或 者 会 被 不 同 的 编辑 器 
读 写 ， 建 议 你 不 要 使 用 制 表 符 。 使 用 空格 或 制 表 符 这 两 种 风格 都 得 到 了 Python 创始 人 的 支 
持 ， 并 被 收录 到 Python 代 码 风 格 指南 文档 。 在 3.4 节 中 你 会 看 到 同样 的 建议 。 

随 着 缩 进深 度 的 增加 ， 代 码 块 的 层次 也 在 加 深 ， 没 有 缩 进 的 代码 块 是 最 高 层次 的 ， 被 称 做 脚 
本 的 “主体 ”(main) 部 分 。 

使 用 缩 进 对 齐 这 种 方式 组 织 代码 ， 不 但 代码 风格 优雅 ， 而 且 也 大 大 提高 了 代码 的 可 读 性 。 而 
How GET '€ielse" (dangling-else) 问题 ， 和 未 写 大 括号 的 单一 子 名 问题 。 (如 果 C 
语言 中 放 语句 没 写 大 括号 ， 而 后 面 却 跟着 两 个 缩 进 的 语句 ， 这 会 造成 不 论 条 件 表达 式 是 否 成 
立 ， 第 二 个 语句 总 会 执行 。 这 种 问题 很 难 调试 ， 不 知道 困惑 了 多 少 程序 员 。 ) 

最 后 一 点 ， 由 于 Python 只 使 用 缩 进 方式 表达 代码 块 丈 辑 ， 因 此 “神圣 的 大 括号 战争 "永远 不 会 发 
生 在 Python 身上 。 C、C++ 和 Java 语 言 中 ， 开 始 大 括号 可 以 在 第 1 行 的 尾部 ， 也 可 以 在 第 2 行 
的 头 部 ， 也 可 以 在 第 2 行 空 几 格 后 开始 ， 这 就 造成 不 同 的 人 选择 不 同 的 风格 ， 于 是 你 就 会 看 到 
大 括号 战争 的 场景 了 。 


3.1.5 ”同一 行书 写 多 个 语句 (;) 


分 号 (;) 允许 你 将 多 个 语句 写 在 同一 行 上 ， 语 句 之 间 用 分 号 隔 开 ， 而 这 些 语句 也 不 能 在 这 行 
开始 一 个 新 的 代码 块 。 这 里 有 一 个 例子 : 


import sys; x = 'foo'; sys.stdout.write(x + '\n') 


必须 指出 一 点 ， 同 一 行 上 书写 多 个 语句 会 大 大 降低 代码 的 可 读 性 ，Python 虽 然 允许 但 不 提倡 
你 这 么 做 。 


3.1.6 ”模块 


每 一 个 Python 脚 本 文件 都 可 以 被 当成 是 一 个 模块 。 模 块 以 磁盘 文件 的 形式 存在 。 当 一 个 模块 
变 得 过 大 ， 并 且 了 驱动 了 太 多 功能 的 话 ， 就 应 该 考虑 拆 一 些 代 码 出 来 另外 建 一 个 模块 。 模 块 里 
的 代码 可 以 是 一 段 直 接 执 行 的 脚本 ， 也 可 以 是 一 堆 类 似 库 函数 的 代码 ， 从 而 可 以 被 别 的 模块 
导入 (import) 调用 。 


3.2 ”变量 赋值 


本 节 主 题 是 变量 赋值 。 我 们 将 在 3.3 小 节 中 讨论 什么 样 的 标识 符 才 是 合法 的 变量 名 。 


3.2.1 赋值 操作 符 


Python 语言 中 ， 等 号 (=) 是 主要 的 赋值 操作 符 (其 他 的 是 增 量 赋值 操作 符 ) 。 
anInt = -12 

aString = 'cart' 

aFloat - -3.1415 * (5.0 ** 2) 

anotherString = 'shop' + 'ping' 


aList = [3.14e10, '2nd elmt of a list', 8.82-4.371j] 


注意 ， 赋 值 并 不 是 直接 将 一 个 值 赋 给 一 个 变量 ， 尽 管 你 可 能 根据 其 他 语言 编程 经 验 认 为 应 该 
如 此 。 在 Python 语言 中 ， 对 象 是 通过 引用 传递 的 。 在 赋值 时 ， 不 管 这 个 对 象 是 新 创建 的 ， 还 
是 一 个 已 经 存在 的 ， 都 是 将 该 对 象 的 引用 〈 并 不 是 值 ) 赋值 给 变量 。 如 果 此 刻 你 还 不 是 100% 
理解 清楚 ， 也 不 用 着 急 。 在 本 章 的 后 面部 分 ， 我 们 还 会 再 讨论 这 个 话题 ， 现 在 你 只 需要 有 这 
么 一 个 概念 即 可 。 

同样 的 ， 如 果 你 比较 熟悉 C， 你 会 知道 赋值 语句 其 实 是 被 当成 一 个 表达 式 (可 以 返回 值 ) 。 不 
过 这 条 并 不 适合 于 Python，Python 的 赋值 语句 不 会 返回 值 。 类 似 下 面 的 语句 在 Python 中 是 非 
法 的 。 


>>> X71 
>>> y= (x= x * 1) # 赋值 语句 不 是 合法 表达 式 
File "«stdin»", line 1 
y - (XS t i) 


A 


SyntaxError: invalid syntax 


链 式 赋值 没 问 题 ， 比 如 (本章 稍 后 部 分 会 给 出 更 多 的 例子 ) 


»»» y - 


=x=x+1 
255» X. y 
(2, 2) 
3.2.2 JH € WW 


E. 


从 Python 2.0 开 始 ， 等 号 可 以 和 一 个 算术 操作 符 组 合 在 一 起 ， 将 计算 结果 重新 赋值 给 左边 的 变 
。 这 被 称 为 增 量 赋值 ， 类 似 下 面 这 样 的 语句 : 


x — x + 1 


现在 可 以 被 写成 : 


x += 1 


增 量 赋值 通过 使 用 赋值 操作 符 ， 将 数学 运算 隐藏 在 赋值 过 程 当 中 。 如 果 你 用 过 C、C++ 或 者 
Java， 会 觉得 下 面 的 操作 符 很 熟悉 。 

+= == *- /= $= ** 

<<= >>= g= 八 二 | = 

增 量 赋值 相对 普通 赋值 不 仅仅 是 写 


法 上 的 改变 ， 最 有 意义 的 变化 是 第 一 个 对 象 〈 我 们 例子 中 
WA) 仅 被 处 理 一 次 。 可 变 对 象 会 被 就 地 修改 (无 修 拷贝 引用 ) ， 不 可 变 对 象 则 和 A=A+B 的 
果 一 样 (分 配 一 个 新 对 象 ) ， 我 们 前 面 提 到 过 ， 有 一 个 例外 就 是 A 仅 被 求 值 一 次 。 


2555» ALLISt 


[123, EVER 
>>> aList += [45.6e7] 

>>> aList 

[123, 'xyz', 456000000.0] 


Python 不 支持 类 似 X++ 或 --X 这 样 的 前 置 /后 置 自 增 / 自 减 运算 。 


3.2.3 ”多重 赋值 


>> £ = y = z =l 
x 


在 上 面 的 例子 中 ， 一 个 值 为 1 的 整 型 对 象 被 创建 ， 该 对 象 的 同一 个 引用 被 赋值 给 X、y 和 Z。 也 
就 是 将 一 个 对 象 贼 给 了 多 个 变量 。 当 然 ， 在 Python 当中 ， 将 多 个 对 象 赋 给 多 个 变量 也 是 可 以 
的 。 


3.2.4 “多 元 ”赋值 


另 一 种 将 多 个 变量 同时 赋值 的 方法 我 们 称 为 多 元 赋值 (multuple) 。 这 不 是 Python 官方 术语 ， 
而 是 我 们 将 "mul-tuple" 连 在 一 起 自 创 的 。 因 为 采用 这 种 方式 赋值 时 ， 等 号 两 边 的 对 象 都 是 元 组 
(我 们 在 2.8 节 讲 过 元 组 是 一 种 Python 基本 数据 类 型 ) 。 


PROC S. We £c- 1. 2. "mw Sering" 

55» x 

1 

>>> y 

2 

>>> Z 

'a string' 
在 上 面 的 例子 里 ， 两 个 整 型 对 象 ( 值 分 别 为 1 和 2) 及 一 个 字符 串 对 象 ， 被 分 别 赋值 给 X, y 和 
Z。 通 常 元 组 需要 用 圆 括 号 (小 括号 ) 括 起 来 ， 尽 管 它 们 是 可 选 的 。 我 们 建议 总 是 加 上 圆 括号 
以 使 你 的 代码 有 更 高 的 可 读 性 。 

So Dt V x) = il. 2, a String) 


在 其 他 类 似 C 的 语言 中 ， 如 果 你 要 交换 两 个 值 ， 你 会 想到 使 用 一 个 临时 变量 如 tmp 来 临时 保存 
其 中 一 个 值 9 


/* C 语言 中 两 个 变量 交换 */ 
tmp = x; 
X = y; 
y = tmp; 
在 上 面 的 C 代 码 片 段 中 ， 变 量 Xx 和 变量 y 的 值 被 互相 交换 。 临 时 变量 tmp 用 于 在 将 y 赋 值 给 X 前 先 


保存 x 的 值 。 将 y 的 值 赋 给 X 之 后 ， 才 可 以 将 保存 在 tmp 变 量 中 的 X 的 值 赋 给 y。Python 的 多 元 赋 
值 方式 可 以 实现 无 需 中 间 变 量 交 换 两 个 变量 的 值 。 


# Python 中 两 个 变量 交换 
PU X, wu o-l. B 


>>> x 

l 

>>> y 

2 

>>> X, y = y, X 
>>> x 

2 

>>> y 


显然 ，Python 在 赋值 之 前 已 经 事先 对 x 和 y 的 新 值 做 了 计算 。 


3.8 标识 符 


标识 符 是 计算 机 语言 中 允许 作为 名 字 的 有 效 字符 串 集合 。 其 中 ， 有 一 部 分 是 关键 字 ， 构 成 语 
言 的 标识 符 。 这 样 的 标识 符 是 保留 字 ， 不 能 用 于 其 他 用 途 ， 否 则 会 引起 语法 错误 
(SyntaxErrorJt 3$ ) ° 


Python 还 有 称 为 "内 建 ”(built-in ) 的 标识 符 集 合 ， 虽 然 它 们 不 是 保留 字 ， 但 是 不 推荐 使 用 这 些 
特别 的 名 字 〈 见 3.3.3) ° 

3.3.1 合法 的 Python 标识 符 

Python 标识 符 字符 串 规 则 和 其 他 大 部 分 用 C 编 写 的 高 级 语言 相似 : 

。 第 一 个 字符 必须 是 字母 或 下 划 线 CO ; 

e 剩 下 的 字符 可 以 是 字母 和 数字 或 下 划 线 ; 


e 大 小 写 敏 感 。 


标识 符 不 能 以 数字 开头 ; 除了 下 划 线 ， 其 他 的 符号 都 不 允许 使 用 。 处 理 下 划 线 最 简单 的 方法 
是 把 它们 当成 字母 字符 。 大 小 写 敏 感 意味 着 标识 符 foo 不 同 于 Foo， 而 这 两 者 也 不 同 于 FOO 。 


3.3.2 ”关键 字 


表 3.1 列 出 了 Python 关 键 字 。 一 般 来 说 ， 任 何 语言 的 关键 字 都 是 相对 稳定 的 ， 但 事情 总 会 改变 
(Python 是 一 种 发 展 和 进化 中 的 语言 )，Keyword 模 块 中 同时 包含 了 一 个 关键 字 列 表 和 一 个 
iskeyword() $% žk ° 



























1341 Python 关键 字 ”( 此 处 部 分 a bc de 为 角 标 ) 
and as" assert | break 
class | continue f def | del 
elif EFR | except | i exec 
finally | for rom ES. id global 
if | import in | is 
lambda | not nr j t pass 
prim | raise retum try 
while » yield? $ " 





a. A Python1.4 开始 关键 学 access 就 被 皮 除了 


b. Python2.6 时 间 入 ， 
c。Python1.5 时 加 入 ， 
d. Python2.3 时 加 入 、 
e. Python2.4 'P JE X Iz «M. 


3.8.8. ^x 


除了 关键 字 之 外 ，Python 还 有 可 以 在 任何 一 级 代码 使 用 的 “内 建 ”(built-in) 的 名 字 集 合 ， 这 些 
名 字 可 以 由 解释 器 设置 或 使 用 。 虽 然 builtin 不 是 关键 字 ， 但 是 应 该 把 它 当 作 "系统 保留 字 ”， 不 
做 他 用 。 然 而 ， 有 些 情 况 要 求 履 盖 (也 就 是 重 定义 、 和 替换 ) 它们 。Python 不 支持 重 载 标识 
符 ， 所 以 任何 时 刻 都 只 有 一 个 名 字 绑 定 。 


我 们 还 可 以 告诉 高 级 读者 built-in 是 builtins “模块 的 成 员 ， 在 你 的 程序 开始 或 在 交互 解释 器 
中 给 出 >>> 提 示 之 前 ， 由 解释 器 自动 导入 的 。 把 它们 看 成 适用 在 任何 一 级 Python 代码 的 全 局 
变量 。 


3.3.4 ”专用 下 划 线 标识 符 


Python 用 下 划 线 作为 变量 前 组 和 后 组 指定 特殊 变量 。 稍 后 我 们 会 发 现 ， 对 于 程序 来 说 ， 其 中 
的 有 些 变量 是 非常 有 用 的 ， 而 其 他 的 则 是 未 知 或 无 用 的 。 这 里 对 Python 中 下 划 线 的 特殊 用 法 
做 了 总 结 名 


e xxx 不 用 from module import” -4A 
e xxx 系统 定义 名 字 


e xx 类 中 的 私有 变量 名 





核心 风格 : 避免 用 下 划 线 作为 变量 名 的 开始 


因为 下 划 线 对 解释 器 有 特殊 的 意义 ， 而 且 是 内 建 标 识 符 所 使 用 的 符号 ， 我 们 建议 程序 员 避 免 

用 下 划 线 作为 变量 名 的 开始 。 一 般 来 讲 ， 变 量 名 _xxx 被 看 作 是 “私有 的 "， 在 模块 或 类 外 不 可 以 
使 用 。 当 变量 是 私有 的 时 候 ， 用 _xxXx 来 表示 变量 是 很 好 的 习惯 。 因 为 变量 名 _xxx 对 Python 来 

说 有 特殊 含义 ， 对 于 普通 的 变量 应 当 避 免 这 种 命名 风格 。 


3.4 基本 风格 指南 

注释 

注释 对 于 自己 和 后 来 人 来 说 都 是 非常 重要 的 ， 特 别 是 对 那些 很 久 没 有 被 动 过 的 代码 而 言 ， 注 
释 更 显得 有 用 了 。 既 不 能 缺少 注释 ， 也 不 能 过 度 使 用 注释 。 尽 可 能 使 注释 简洁 明了 ， 并 放 在 
最 合适 的 地 方 。 这 样 注释 便 为 每 个 人 节省 了 时 间 和 精力 。 记 住 ， 要 确保 注释 的 准确 性 。 
文档 

Python 还 提供 了 一 个 机 制 ， 可 以 通过 ”doc ”特别 变量 ， 动 态 获得 文档 字 串 。 在 模块 、 类 声 
明 、 或 函数 声明 中 第 一 个 没有 赋值 的 字符 串 可 以 用 属性 obj. doc 来 进行 访问 ， 其 中 obj 是 一 
个 模块 、 类 、 或 函数 的 名 字 。 这 在 运行 时 也 可 以 进行 | 

缩 进 

因为 缩 进 对 齐 有 非常 重要 的 作用 ， 你 得 考虑 用 什么 样 的 缩 进 风格 才 让 代码 容易 阅读 。 在 选择 
要 空 的 格 数 的 时 候 ， 常 识 也 起 着 非常 大 的 作用 。 

1 个 或 2 个 可 能 不 够 ， 很 难 确定 代码 语句 属于 哪个 块 。 

8 一 10 个 可 能 太 多 ， 如 果 代 码 内 具 的 层次 太 多 ， 就 会 使 得 代码 很 难 阅 读 。4 个 空格 非常 的 流 
行 ， 更 不 用 说 Python 的 创造 者 也 支持 这 种 风格 。5 和 6 个 也 不 坏 ， 但 是 文本 编辑 器 通常 不 支持 
这 样 的 设置 ， 所 以 也 不 经 常 使 用 。3 个 和 7 个 是 边界 情况 。 


当 使 用 制 表 符 Tab 的 时 候 ， 请 记 住 不 同 的 文本 编辑 器 对 它 的 设置 是 不 一 样 。 如 果 你 的 代码 会 存 
在 并 运行 在 不 同 的 平台 上 ， 或 者 会 用 不 同 的 文本 编辑 器 打开 ， 建 议 你 不 要 使 用 Tab 。 


选择 标识 符 名 称 


好 的 判断 也 适用 于 选择 标识 符 名 称 ， 请 为 变量 选择 短 而 意义 丰富 的 标识 符 。 虽 然 变 量 名 的 长 
度 对 于 今天 的 编程 语言 不 再 是 一 个 问题 ， 但 是 使 用 简短 的 名 字 依然 是 个 好 习惯 ， 这 个 原则 同 
样 使 用 于 模块 (Python 文件 ) 的 命名 。 


Python 风格 指南 


Guido van Rossum 在 多 年 前 写 下 Python 代码 风格 指南 。 目 前 它 已 经 被 至 少 3 个 PEP 代 替 : 
7 (C 代 码 风 格 指南 ) 、8 《Python 代码 风格 指南 ) 和 257 (文档 字符 串 规 范 ) 。 这 些 PEP 被 归 
档 、 维 护 并 定期 更 新 。 


渐渐 地 ， 你 会 听 到 “Pythonic" 这 个 术语 ， 它 指 的 是 以 Python 的 方式 去 编写 代码 、 组 织 逻 辑 和 对 
RATA ° RAVE RTA ERMEE ° PEP 20 写 的 是 Python 之 祥 ， 你 可 以 从 那里 开 
始 探索 “Pythonic" 站 正 含义 的 旅程 。 如 果 你 不 能 上 网 ， 但 想 看 到 它 ， 那 就 从 你 的 Python 解释 器 
输入 import this 然 后 回 车 。 下 面 是 一 些 网 上 资源 。 


www.Python.org/doc/essays/styleguide.html 
www.Python.org/dev/peps/pep-0007/ 
www.Python.org/dev/peps/pep-0008/ 
www.Python.org/dev/peps/pep-0020/ 


www.Python.org/dev/peps/pep-0257 


3.4.1 模块 结构 和 布局 


用 模块 来 合理 组 织 你 的 Python 代码 是 简单 又 自然 的 方法 。 你 应 该 建立 一 种 统一 且 容 易 阅 读 的 
结构 ， 并 将 它 应 用 到 每 一 个 文件 中 去 。 下 面 就 是 一 种 非常 合理 的 布局 。 


(1) 起 始 行 (Unix) 
(2) 模块 文档 
(3) 模块 导入 


(4) 变量 定义 


Python 核心 编程 第 二 版 
(1) ”起 始 行 


通常 只 有 在 类 Unix 环 境 下 才 使 用 起 始 行 ， 有 起 始 行 就 能 够 仅 输 入 脚本 名 字 来 执行 脚本 ， 无 需 
直接 调用 解释 器 。 


(2) ”模块 文档 


简要 介绍 模块 的 功能 及 重要 全 局 变量 的 含义 ， 模 块 外 可 通过 module. doc 访问 这 些 内 容 。 


(1) 起 始 行 


(2) 模块 文档 (文档 字符 串 ) 


(3) 模块 导入 


(4) (全 局 ) 变量 定义 


class FooClass (object): 


dee qp (5) 类 定义 〈 若 有 ) 
pass 


def test(): 
"test function" 
foo = FooClass() (6) 函数 定义 Gt) 
if debug: 
print 'ran test()' 


test() (7) 主 程序 





图 3-1 典型 Python 文件 结构 
(3) BORSA 


导入 当前 模块 的 代码 需要 的 所 有 模块 ; 每 个 模块 仅 导 入 一 次 (当前 模块 被 加 载 时 ) ; 函数 内 
部 的 模块 导入 代码 不 会 被 执行 ， 除 非 该 函数 正在 执行 。 


(4) ”变量 定义 


这 里 定义 的 变量 为 全 局 变量 ， 本 模块 中 的 所 有 函数 都 可 直接 使 用 。 从 好 的 编程 风格 角度 说 ， 
除非 必须 ， 否 则 就 要 尽量 使 用 局 部 变量 代替 全 局 变量 ， 如 果 坚 持 这 样 做 ， 你 的 代码 就 不 但 容 
多 维护 ， 而 且 还 可 以 提高 性 能 并 节省 内 存 。 


$33 ” Python 基础 80 


(5) XX 3&6 


所 有 的 类 都 需要 在 这 里 定义 。 当 模块 被 导入 时 class 语 名 会 被 执行 ， 类 也 就 会 被 定义 。 类 的 文 
档 变 量 是 class. doc ° 


(6) 函数 定义 语句 


此 处 定义 的 函数 可 以 通过 module.function() 在 外 部 被 访问 到 ， 当 模块 被 导入 时 def 语 名 会 被 执 
行 ， 函 数 也 就 都 会 定义 好 ， 函 数 的 文档 变量 是 function. doc ° 


(7) ŁR 


无 论 这 个 模块 是 被 别 的 模块 导入 还 是 作为 脚本 直接 执行 ， 都 会 执行 这 部 分 代码 。 通 常 这 里 不 
会 有 太 多 功能 性 代码 ， 而 是 根据 执行 的 模式 调用 不 同 的 函数 。 





核心 风格 : 主 程序 调用 main() 函 数 


主 程 序 代码 通常 都 和 你 前 面 看 到 的 代码 相似 ， 检 查 _name 变量 的 值 然后 再 执行 相应 的 调用 
(参阅 下 一 个 核心 笔记 ) 。 主 程序 中 的 代码 通常 包括 变量 赋值 、 类 定义 和 函数 定义 ， 随 后 检 
& name __ 来 决定 是 否 调用 另 一 个 函数 〈 通 常 调 用 main() 函 数 ) 来 完成 该 模块 的 功能 。 主 程 
序 通常 都 是 做 这 些 事 。 (我 们 上 面 的 例子 中 使 用 test() 而 不 是 main() 是 为 了 避免 你 在 读 到 核心 
笔记 前 感到 迷惑 。) 不 管用 什么 名 字 ， 我 们 想 强 调 的 是 : 这 儿 是 放置 测试 代码 的 好 地 方 。 我 
们 在 3.4.2 小 节 中 曾经 说 过 ， 大 部 分 的 Python 模块 都 是 用 于 导入 调用 的 ， 直 接 运 行 模 块 应 该 调 

用 该 模块 的 回归 测试 代码 。 


很 多 项 目 都 是 一 个 主 程序 ， 由 它 导 入 所 有 需要 的 模块 。 所 以 请 记 住 ， 绝 大 部 分 的 模块 创建 的 
目的 是 为 了 被 别人 调用 而 不 是 作为 独立 执行 的 脚本 。 我 们 也 很 可 能 创建 一 个 Python 库 风格 的 
模块 ， 这 种 模块 的 创建 目的 就 是 为 Je EA 总 之 ， 只 有 一 个 模块 ， 也 就 是 包含 主 
程序 的 模块 会 被 直接 执行 ， 或 由 用 户 通 过 命令 行 执 行 ， AES RUE RUS > S d Unix cron 任 
务 定时 执行 ， 或 通过 Web 服 务 器 调用 ， 或 通过 GUI 执行 。 





时 刻 记 住 一 个 事实 , 那 就 是 所 有 的 模块 都 有 能 力 来 执行 代码 。 最 高 级 别 的 Python 语 台 
是 说 ， 那 些 没有 缩 进 的 代码 行 一 一 在 模块 被 导入 时 就 会 执行 ， 不 管 是 不 是 丨 的 需要 执行 。 由 
于 有 这 样 一 个 “特性 ”， 上 比较 安全 的 写 代码 的 方式 就 是 除了 那些 盖 正 需 要 执行 的 代码 以 外 ， 几 乎 
所 有 的 功能 代码 都 在 函数 当中 。 再 说 一 遍 ， 通 常 只 有 主 程序 模块 中 有 大 量 的 顶级 可 执行 代 
码 ， 所 有 其 他 被 导入 的 模块 只 应 该 有 很 少 的 顶级 执行 代码 ， 所 有 的 功能 代码 都 应 该 封装 在 二 
数 或 类 当中 。 (参阅 核心 笔记 了 解 更 多 信息 ) 





核心 笔记 : name 指示 模块 应 如 何 被 加 载 


由 于 主 程序 代码 无 论 模块 是 被 导入 还 是 被 直接 执行 都 会 运行 ， 我 们 必须 知道 模块 如 何 决 定 运 
行 方向 。 一 个 应 用 程序 可 能 需要 导入 另 一 个 应 用 程序 的 一 个 模块 ， 以 便 重 用 一 些 有 用 的 代码 
(否则 就 只 能 用 拷贝 粘贴 那 种 非 面向 对 象 的 策 拙 手段 ) 。 这 种 情况 下 ， 你 只 想 访 问 那些 位 于 
其 他 应 用 程序 中 的 代码 ， 而 不 是 想 运行 那个 应 用 程序 。 因 此 一 个 问题 出 现 了 ，“Python 是 否 有 
一 种 方法 ， 能 在 运行 时 检测 该 模块 是 被 导入 还 是 被 直接 执行 呢 ? "答案 就 是 .. (掌声 雷动 ) …. 
没 错 ! name 系统 变量 就 是 正确 答案 。 


e 如 果 模 块 是 被 导入 ， name 的 值 为 模块 名 字 ; 


e 如 果 模 块 是 被 直接 执行 ， name 的 值 为 main’。 


3.4.2 在 主 程序 中 书写 测试 代码 


优秀 的 程序 员 和 软件 工程 师 ， 总 是 会 为 我 们 的 应 用 程序 提供 一 组 测试 代码 或 者 简单 教程 。 对 
那些 仅仅 为 了 让 别 的 程序 导入 而 创建 的 模块 来 说 ，Python 有 效 地 简化 了 这 个 任务 。 这 些 模块 
理论 上 永远 不 会 被 直接 执行 ， 那 么 ， 在 这 个 模块 被 直接 执行 时 进行 系统 测试 岂 不 妙 哉 ?设置 
起 来 难 吗 ? 一 点 儿 也 不 难 。 


测试 代码 仅 当 该 文件 被 直接 执行 时 运行 ， 也 就 是 说 ， 不 是 在 被 别 的 模块 导入 时 。 上 文 及 核心 
笔记 中 提 到 如 何 判 断 一 个 模块 是 被 直接 运行 还 是 被 导入 的 。 我 们 应 该 利用 name € € x^ 
有 利 条 件 。 将 测试 代码 放 在 一 个 叫做 main() 或 test() (或 者 你 随便 取 个 名 字 ) 的 函数 中 ， 如 果 
该 模块 是 被 当成 脚本 运行 ， 就 调用 这 个 函数 。 


这 些 测试 代码 应 该 随 着 测试 条 件 及 测试 结果 的 变更 及 时 修改 ， 每 次 代码 更 新 都 应 该 运行 这 些 
测试 代码 ， 以 确认 修改 没有 引发 新 闻 题 。 只 要 坚持 这 样 做 ， 你 的 代码 就 会 足够 健壮 ， 更 不 用 
提 验 证 和 测试 新 特性 和 更 新 了 。 


在 主 程序 中 放置 测试 代码 是 测试 模块 的 简单 快捷 的 手段 。Python 标 准 库 中 还 提供 了 unittest 模 
块 ， 有 时 候 它 被 称 为 PyUnit， 是 一 个 测试 框架 。 如 何 使 用 unittest 超 出 了 本 书 的 范围 ， 不 过 当 
需要 对 一 个 大 系统 的 组 件 进行 正规 系统 的 回归 测试 时 ， 它 就 会 派 上 用 场 。 


3.5 内存 管理 


到 现在 为 止 ， 你 已 经 看 了 不 少 Python 代码 的 例子 。 我 们 本 节 的 主题 是 变量 和 内 存 管理 的 细 
节 ， 包 括 : 


e 变量 无 须 事 先 声明 ; 


。 程序 员 不 用 关心 内 存 管理 ; 

。 变量 名 会 被 "回收 ”; 

。 del 话 句 能 够 直接 释放 资源 。 

3.5.1 变量 定义 

大 多 数 编译 型 语言 ， 变 量 在 使 用 前 必须 先 声 明 ， 其 中 的 C 语 言 更 加 苛刻 : 变量 声明 必须 位 于 代 
码 块 最 开始 ， 且 在 任何 其 他 语句 之 前 。 其 他 语言 ， 像 Ct+ 和 Java， 人 允许 "随时 随地 "声明 变量 ， 
比如 ， 变 量 声明 可 以 在 代码 块 的 中 间 ， 不 过 仍然 必须 在 变量 被 使 用 前 声明 变量 的 名 字 和 类 


型 。 在 Python 中 ， 无 需 此 类 显 式 变量 声明 语句 ， 变 量 在 第 一 次 被 赋值 时 自动 声明 。 和 其 他 大 
多 数 语言 一 样 ， 变 量 只 有 被 创建 和 赋值 后 才能 被 使 用 。 


DD Sa 


Traceback (innermost last): 


Fille "€stdin»", line l1, in ? 
NameError: a 
变量 一 旦 被 赋值 ， 你 就 可 以 通过 变量 名 来 访问 它 。 
>>> x = 4 
>>> y m Chig 195 a string" 
5p» X 
4 
> y 


"EHIS 19 € SELIO” 


3.5.2 动态 类 型 


还 要 注意 一 点 ，Python 中 不 但 变量 名 无 需 事先 声明 ， 而 且 也 无 需 类 型 声明 。 在 Python 语言 
中 ， 对 象 的 类 型 和 内 存 占用 都 是 运行 时 确定 的 。 尽 管 代码 被 编译 成 字 节 码 ，Python 仍 然 是 一 
种 解释 型 语言 。 在 创建 也 就 是 赋值 时 ， 解 释 器 会 根据 语法 和 右 侧 的 操作 数 来 决定 新 对 象 


的 类 型 。 在 对 象 创建 后 ， 一 个 该 对 象 的 应 用 会 被 赋值 给 左 侧 的 变量 。 


3.5.3 内存 分 配 


作为 一 个 负责 任 的 程序 员 ， 我 们 知道 在 为 变量 分 配 内 存 时 ， 是 在 借用 系统 资源 ， 在 用 完 之 
后 ， 应 该 释放 借用 的 系统 资源 。Python 解 释 器 承担 了 内 存 管理 的 复杂 任务 ， 这 大 大 简化 了 应 
用 程序 的 编写 。 你 只 需要 关心 你 要 解决 的 问题 ， 至 于 底层 的 事情 放心 交 给 Python 解释 器 去 做 
就 行 了 。 


3.5.4 引用 计数 


要 保持 追踪 内 存 中 的 对 象 ，Python 使 用 了 引用 计数 这 一 简单 技术 。 也 就 是 说 Python 内 部 记录 
着 所 有 使 用 中 的 对 象 各 有 多 少 引 用 。 你 可 以 将 它 想像 成 扑克 牌 游 戏 " 黑 杰克 "或 21 点"。 一 个 内 
部 跟踪 变量 ， 称 为 一 个 引用 计数 器 。 每 个 对 象 各 有 多 少 个 引用 ， 简 称 引 用 计数 。 当 对 象 被 创 
建 时 ， 就 创建 了 一 个 引用 计数 ， 当 这 个 对 象 不 再 需要 时 ， 也 就 是 说 ， 这 个 对 象 的 引用 计数 变 
为 0 时 ， 它 被 垃圾 回收 。 (严格 来 说 这 不 是 100% 正 确 ， 不 过 现 阶段 你 可 以 就 这 么 理解 ) 


1. 增加 引用 计数 
当 对 象 被 创建 并 (将 其 引用 ) 赋值 给 变量 时 ， 该 对 象 的 引用 计数 就 被 设置 为 1。 


当 同 一 个 对 象 (的 引用 ) 又 被 赋值 给 其 他 变量 时 ， 或 作为 参数 传递 给 函数 、 方 法 或 类 实例 
时 ， 或 者 被 赋值 为 一 个 窗口 对 象 的 成 员 时 ， 该 对 象 的 一 个 新 的 引用 ， 或 者 称 作 别名 ， 就 被 创 
建 ( 则 该 对 象 的 引用 计数 自动 加 1) 。 


请 看 以 下 声明 。 


3.14 


X 


X 


XY 


语句 X=3.14 创 建 了 一 个 浮 点 型 对 象 并 将 其 引用 赋值 给 X。X 有 是 第 一 个 引用 ， 因 此 ， 该 对 象 的 引 
用 计数 被 设置 为 1。 语 句 yY=X 创 建 了 一 个 指向 同一 对 象 的 别名 y〈 参 阅 图 3-2) 。 事 实 上 并 没有 
为 Y 创 建 一 个 新 对 象 ， 而 是 该 对 象 的 引用 计数 增加 了 1 次 〈 变 成 了 2) 。 这 是 对 象 引用 计数 增加 
的 方式 之 一 。 还 有 一 些 其 他 的 方式 也 能 增加 对 象 的 引用 计数 ， 比 如 该 对 象 作为 参数 被 函数 调 
用 或 这 个 对 象 被 加 入 到 某 个 容器 对 象 当 中 时 。 
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A 3-2 有 两 个 引用 的 同一 对 象 
总 之 ， 对 象 的 引用 计数 增加 时 : 
。 对 象 被 创建 
Xx = 3.14 


e 或 另外 的 别名 被 创建 
y C 
e 或 被 作为 参数 传递 给 函数 (新 的 本 地 引用 ) 
foobar (x) 
e 或 成 为 容器 对 象 的 一 个 元 素 
mybist = [123, x, "'xvz'] 
下 面 让 我 们 来 看 一 下 引用 计数 是 如 何 变 少 的 。 
2. 减少 引用 计数 
当 对 象 的 引用 被 销 妈 时 ， 引 用 计数 会 减 小 。 最 明显 的 例子 就 是 当 引 用 离开 其 作用 范围 时 ， 这 
种 情况 最 经 常 出 现在 函数 运行 结束 时 ， 所 有 局 部 变量 都 被 自动 销毁 ， 对 象 的 引用 计数 也 就 随 
ZAS o 
当 变 量 被 赋值 给 另外 一 个 对 象 时 ， 原 对 象 的 引用 计数 也 会 自动 减 1 : 


foo = 'xyz' 
bar = foo 
foo = 123 


第 3 章 ” Python 基础 E 


当 字 符 囊 对 象 “xyz" 被 创建 并 赋值 给 foo 时 ， 它 的 引用 计数 是 1。 当 增加 了 一 个 别名 bar 时 ， 引 用 
计数 变 成 了 2。 不 过 当 foo 被 重新 赋值 给 整 型 对 象 123 时 ，xyz 对 象 的 引用 计数 自动 减 1， 又 重新 
变 成 了 1。 


其 他 造成 对 象 的 引用 计数 减少 的 方式 包括 使 用 del 语 句 删 除 一 个 变量 (参阅 稍 后 小 节 ) ， 或 者 
当 一 个 对 象 被 移出 一 个 窗口 对 象 时 (或 该 容器 对 象 本 身 的 引用 计数 变 成 了 0 时 ) 。 总 结 一 下 ， 
一 个 对 象 的 引用 计数 在 以 下 情况 下 会 减少 。 


e 一 个 本 地 引用 离开 了 其 作用 范围 。 比 如 foobar() (参见 刚才 的 例子 ) AAE R o 


。 对 象 的 别名 被 显 式 销毁 。 
del y # or del x 
e 对 象 的 一 个 别名 被 赋值 给 其 他 对 象 。 


Xx - 123 


e 对 象 被 从 一 个 窗口 对 象 中 移 除 。 


myList.remove (x) 


窗口 对 象 本 身 被 销毁 。 
del myList # or goes out-of-scope 
参阅 11.8 节 了 解 更 多 变量 作用 范围 的 信息 。 


3. deli$ 
Del 语 名 会 删除 对 象 的 一 个 引用 ， 它 的 语法 如 下 。 


del objl[, obj2[,... objN]] 


例如 ， 在 上 例 中 执行 del y 会 产生 两 个 结果 。 
。 从 现在 的 名 称 空间 中 删除 y 。 


e. X 的 引用 计数 减 1。 


引申 一 步 ,执行 del x 会 删除 该 对 象 的 最 后 一 个 引用 ， 也 就 是 该 对 象 的 引用 计数 会 减 为 0, 这 会 导 
致 该 对 象 从 此 "无 法 访问 或 "无 法 抵达 "。 从 此 刻 起 ， 该 对 象 就 成 为 垃圾 回收 机 制 的 回收 对 象 。 
注意 任何 追踪 或 调试 程序 会 给 一 个 对 象 增加 一 个 额外 的 引用 ， 这 会 推迟 该 对 象 被 回收 的 时 
间 。 


3.5.5 垃圾 收集 


不 再 使 用 的 内 存 会 被 一 种 称 为 垃圾 收集 的 机 制 释 放 。 像 上 面 说 的 ， 虽 然 解 释 器 跟踪 对 象 的 引 
用 计数 ， 但 垃圾 收集 器 负责 释放 内 存 。 垃 圾 收集 器 是 一 块 独立 代码 ， 它 用 来 寻找 引用 计数 为 0 
的 对 象 。 它 也 负责 检查 那些 虽然 引用 计数 大 于 0 但 也 应 该 被 销毁 的 对 象 。 特 定 情形 会 导致 循环 
引用 。 


一 个 循环 引用 发 生 在 当 你 有 至 少 两 个 对 象 互相 引用 时 ， 也 就 是 说 所 有 的 引用 都 消失 时 ， 这 些 
引用 仍然 存在 ， 这 说 明 只 靠 引用 计数 是 不 够 的 。Python 的 垃圾 收集 器 实际 上 是 一 个 引用 计数 
器 和 一 个 循环 垃圾 收集 器 。 当 一 个 对 象 的 引用 计数 变 为 0, 解 释 器 会 暂停 ， 释 放 掉 这 个 对 象 和 仅 
有 这 个 对 象 可 访问 (可 到 达 ) 的 其 他 对 象 。 作 为 引用 计数 的 补充 ， 垃 圾 收集 器 也 会 留心 被 分 
配 的 总 量 很 大 的 (及 未 通过 引用 计数 销毁 的 那些 ) 对 象 。 在 这 种 情况 下 ， 解 释 器 会 暂停 下 
来 ， 试 图 清理 所 有 未 引用 的 循环 。 


3.6 ”第 一 个 Python 程序 


我 们 已 经 熟悉 了 语法 、 代 码 风 格 、 变 量 赋值 及 内 存 分 配 ， 现 在 来 看 一 点 略微 复杂 的 代码 。 这 
个 例子 中 还 有 你 不 熟悉 (我 们 还 未 讲 到 的 ) 的 Python 结构 ， 不 过 我 们 相信 因为 Python 非常 的 
简单 和 优雅 ， 你 一 定 可 以 型 懂 每 一 行 代码 的 用 途 。 


我 们 将 要 介绍 两 段 处 理 文本 文件 的 相关 脚本 。 首 先是 makeTextFile.py， 创 建 一 个 文本 文件 ; 
它 提示 用 户 输 入 每 一 行文 本 ， 然 后 将 结果 写 到 文件 中 。 另 一 个 是 readTextFile.py， 读 取 并 显示 
该 文本 文件 的 内 容 。 研 究 一 下 这 两 段 代码 ， 看 看 他 们 是 如 何 工作 的 。 


例 3.1 创建 文件 (makeTextFile.py ) 


这 个 脚本 提醒 用 户 输入 一 个 ( 尚 不 存在 的 ) 文件 名 ， 然 后 由 用 户 输入 该 文件 的 每 一 行 。 最 
后 ， 将 所 有 文本 写 入 文本 文件 。 


i! /usr/bin/env python 


3 'makeTextFile.py -- create text file' 


5 import os 


6 ls = os.linesep 
B $ get filename 
9 while True: 

10 


11 if os.path.exists(fname): 
12 print "ERROR: '$s' already exists" *$ fname 


13 else: 


14 break 

15 

16 $ get file content (text) lines 
17 all = 


^" 


18 print "WAnEnter lines ('.' by itself to quít).'n 


20 & loop until user terminates input 


21 while True: 


22 entry = raw input('» ') 
23 if entry mm '.': 

24 break 

25 else: 

26 all.append(entry) 
21 


29 4 write lines to file with proper line-ending 
29 fobj = open(fname, 'w') 

30 fobj.writelines(['*53$5' $ (x, 15) for x in allj) 
31 fobj.close() 


print 'DONE!' 
1~3 行 


UNIX 启 动 行 之 后 是 模块 的 文档 字符 串 。 应 该 坚持 写 简 洁 并 有 用 的 文档 字符 囊 。 这 里 我 们 写 的 
有 点 短 ， 不 过 对 这 段 代 码 已 经 够 用 了 。 (建议 读者 看 一 下 标准 库 中 cgi 模 块 的 文档 字符 串 ， 那 
是 一 个 很 好 的 示例 ) 。 


5~6 行 


之 后 我 们 导入 os 模块 ， 在 第 6 行 我 们 为 os.linesep 属 性 取 了 一 个 新 别名 。 这 样 做 一 方面 可 以 缩 
短 变量 名 ， 另 一 方面 也 能 改善 访问 该 变量 的 性 能 。 


核心 提示 : 使 用 局 部 变量 替换 模块 变量 


类 似 os.linesep 这 样 的 名 字 需 要 解释 器 做 两 次 查询 : (1) 查找 os 以 确认 它 是 一 个 模块 ， 

(2) 在 这 个 模块 中 查找 linesep 变 量 。& 为 模块 也 是 全 局 变量 ， 我 们 多 消耗 了 系统 资源 。 如 果 
你 在 一 个 函数 中 像 这 样 频繁 使 用 一 个 属性 ， 我 们 建议 你 为 该 属性 取 一 个 本 地 变量 别名 。 变 量 
查找 速度 将 会 快 很 多 一 “在 查找 全 局 变量 之 前 ， 总 是 先 查找 本 地 变量 。 这 也 是 一 个 让 你 的 程 
序 跑 的 更 快 的 技巧 : 将 经 常用 到 的 模块 属性 蔡 换 为 一 个 本 地 引用 。 代 码 “ 跑 "得 更 快 ， 而 也 不 
用 老 是 敲 那 么 长 的 变量 名 了 。 在 我 们 的 代码 片段 中 ， 并 没有 定义 函数 ， 所 以 不 能 给 你 定义 本 
地 别名 的 示例 。 不 过 我 们 有 一 个 全 局 别名 ， 至 少 也 减少 了 一 次 名 字 查 询 。 


8 ~ 4 行 


显然 这 是 一 个 无 限 循环 ， 也 就 是 说 除非 我 们 在 While 语句 体 中 提供 break 语 句 ， 否 则 它 会 一 直 特 
环 下 去 。 


while 语 句 根 据 后 面 的 表达 式 决定 是 否 进 行 下 一 次 循环 ， 而 True 则 确保 它 一 直 循 环 下 去 。 
10 ~ 14 行 


提示 用 户 输 入 一 个 未 使 用 的 文件 名 。raw input() 内 建 函 数 接受 一 个 "提示 字符 串 " 参 数 ， 作 为 对 
用 户 的 提示 信息 。raw_input() 返 回 用 户 输入 的 字符 串 ， 也 就 是 为 fname 赋 值 。 如 果 用 户 不 小 心 
输入 了 一 个 已 经 存在 的 文件 的 字 ， 我 们 要 提示 这 个 用 户 重 新 输入 另 一 个 名 字 。 
os.path.exists() 是 os 模块 中 一 个 有 用 的 函数 ， 帮 助 我 们 确认 这 一 点 。 当 有 输入 一 个 不 存在 的 文 
件 名 时 ，os.path.exists() 才 会 返回 False, 这 时 我 们 中 断 循 环 继 续 下 面 的 代码 。 


16 ~ 26 行 


这 部 分 代码 提供 用 户 指令 ， 引 导 用 户 输入 文件 内 容 ， 一 次 一 行 。 我 们 在 第 17 行 初始 化 了 列表 
all， 它 用 来 保存 每 一 行文 本 。 第 21 行 开始 另 一 个 无 限 循环 ， 提 示 用 户 输 入 每 一 行文 本 ， 一 行 
仅 输入 一 个 句点 C) 表示 输入 结束 。23~26 行 的 半 -else 语 名 判断 是 否 满足 结束 条 件 以 中 止 特 
iR (24 行 ) ， 否 则 就 再 添加 新 的 一 行 (26 行 ) 。 


28 ~ 32 行 


现在 所 有 内 容 都 保存 在 内 存 当 中 ， 我 们 需要 将 它们 保存 到 文件 。 第 29 行 打开 文件 准备 进行 写 
操作 ， 第 30 行 将 内 存 中 的 内 容 逐 行 写 入 文件 。 每 个 文件 都 需要 一 个 行 结 束 符 (或 文件 结束 字 
fj) 。 第 30 行 的 结构 称 为 列表 解析 ， 它 进行 以 下 工作 : 对 我 们 文件 的 每 一 行 ， 根 据 程 序 运行 
平台 添加 一 个 合适 的 行 结 束 符 。'%s%s’ 为 每 一 行 添加 行 结 束 符 ，(Xx，|s) 表示 每 一 行 及 其 行 
结束 符 ， 对 Unix 平 台 ， 是 \n', 对 DOS 或 win32 平 台 ， 则 是 和 r\n’'。 通 过 使 用 os.lineseq, 我 们 不 必 
关心 程序 运行 在 什么 平台 ， 也 不 必要 根据 不 同 的 平台 决定 使 用 哪 种 行 结束 符 。 文 件 对 象 的 
writelines() 方 法 接收 包含 行 结束 符 的 结果 列表 ， 并 将 它 写 入 文件 。 


不 错 吧 。 现 在 来 看 一 下 如 何 查看 刚刚 创建 的 文件 。 出 于 这 个 目的 ， 我 们 创建 了 第 二 个 Python 
脚本 ，readTextFile.py。 你 会 看 到 ， 它 比 makeTextFile.py 短 的 多 。 创 建 一 个 文件 的 复杂 度 总 
是 比 读 取 它 要 大 。 你 可 能 感 兴 趣 的 、 有 新 意 的 一 点 在 于 异常 处 理 的 出 现 。 


1~ 3 行 


和 前 面 一 样 ， 是 Unix 启 动 行 及 模块 文档 字符 串 。 
5~7 行 
不 同 于 makeTextFil.py， 我 们 在 这 个 例子 中 不 再 关心 用 户 是 否 输入 合适 的 文件 名 。 


例 3.2 文件 读 取 和 显示 (readTextFile.py ) 


1 ik'!/usr/bin/env python 
2 
3 'readTextFile.py -- read and display text file' 
4 
5 # get filename 
6 fname = raw input('Enter filename: ') 
T print 
8 
9 # attempt to open file for reading 
10 try: 
11 fobj = open(fname, 'r') 


12 except IOError, e: 


13 print "*** file open error:", e 
14 else: 

15 & display contents to the screen 
16 for eachLine in fobj: 

17 print eachLine, 

18 fobj.close() 


换 句 话说， 我 们 在 其 他 地 方 进行 验证 工作 (如 果 需 要 ) 。 第 7 行 打 印 一 个 空 行 ， 以 便 将 提示 信 
息 和 文件 内 容 分 隔 开 来 。 


9~18 行 


脚本 的 剩余 部 分 展示 了 一 种 新 的 Python 结构 ，try-except-else 语 多。try 子 名 是 一 段 我 们 希望 监 
测 错误 的 代码 块 。 在 第 10~~11 行 代码 ， 我 们 尝试 打开 用 户 输入 的 文件 。except 子 名 是 我 们 处 
理 错误 的 地 方 。 在 12 一 13 行 ， 我 们 检查 open() 是 否 失败 -通常 是 IOError 类 型 的 错误 。 


最 后 ，14 一 18 行 的 else 子 名 在 try 代 码 块 运行 无 误 时 执行 。 我 们 在 这 几 将 文件 的 每 一 行 显示 在 
屏幕 上 。 注 意 由 于 我 们 没有 移 除 代表 每 行 结束 的 行 结束 符 ， 我 们 不 得 不 抵制 print 语 名 自动 生 
成 的 行 结束 符 一 “通过 在 print 语 名 的 最 后 加 一 个 过 号 可 以 达到 这 一 目的 。 第 18 行 关闭 文件 ， 
从 而 结束 这 段 脚本 。 


最 后 要 讲 的 一 点 是 关于 使 用 os.path.exists() 和 异常 处 理 : 一 般 程序 员 倾 向 于 使 用 前 者 ， 因 为 有 
一 个 现成 的 函数 可 以 检查 错误 条 件 一 一 并 且 很 简单 ， 这 是 个 布尔 ， 它 会 告 你 “是 ”还 是 “不 
是 ”( 注意 ， 这 个 函数 内 可 能 已 经 有 蜡 常 处 理 代 码 ) 。 那 你 为 什么 还 要 重新 发 明 一 个 轮子 来 干 


同样 一 件 事 ? Fer AD EE RE JE 9] Poe ^ ARA eie I9] ER CAE EE CREAR US] DAR o X JEE 

员 必须 识别 a ， 并 做 出 相应 处 理 。 对 我 们 的 例子 来 说 ， 我 们 能 够 通过 检查 文 

件 是 否 存 在 来 避免 异常 发 生 ， 不 过 因为 有 可 能 因为 其 他 原因 造成 文件 打开 失败 ， 比 如 缺少 权 

限 ， 网 络 驱动 器 突然 连接 失败 等 等 。 从 更 安全 的 角度 来 说 ， 就 不 应 该 使 用 类 似 os.path.exists() 
之 类 的 函数 ， 而 是 使 用 异常 处 理 ， 尤 其 是 在 没有 合适 函数 的 情况 下 更 应 如 此 。 


你 会 在 第 9 章 中 找到 更 多 文件 系统 函数 的 例子 ， 在 第 10 章 则 有 更 多 关于 异常 处 理 的 知识 。 


3.7. 相关 模块 和 开发 工具 


《Python 风 格 指南 》 (Python Style Guide, 、《Python 快 速 参考 指南 》 (Python 
et Reference Guide) 和 《Python 常 见 问答 》 (Python FAQ) 都 是 开发 者 很 重要 的 “ 工 
o 另外， 还 有 一 些 模 块 会 帮助 你 成 为 2 Python 程序 员 。 


调试 器 : pdbo 
记录 器 : logging ° 
性 能 测试 器 : profile、hotshot、cProfile » 


logging 模 块 是 在 Python2.3 中 新 增 的 ， 它 定义 了 一 些 函 数 和 类 帮助 你 的 程序 实现 灵活 的 日 志 系 
统 。 共 有 五 级 日 志 级 别 : 紧急、 错误、 警告、 信息 和 调试 。 


历史 上 ， 不 同 的 人 们 为 了 满足 不 同 的 需求 重复 实现 了 很 多 性 能 测试 器 ，Python 也 有 好 几 个 性 
能 测试 模块 。 最 旱 的 Python profile 模 块 是 Python 写成 的 ， 用 来 测试 函数 的 执行 时 间 及 每 次 脚 
本 执行 的 总 时 间 ， 既 没有 特定 函数 的 执行 时 间 也 没有 被 包含 的 子 函 数 调 用 时 间 。 在 三 个 profile 
模块 中 ， 它 是 最 老 的 也 是 最 慢 的 ， 尽 管 如 此 ， 它 仍然 可 以 提供 一 些 有 价值 的 性 能 信息 。 
hotshot 模 块 是 在 Python2.2 中 新 增 的 ， 它 的 目标 是 取代 profile 模 块 ， 它 修复 了 profile 模 块 的 一 
些 错误 ， 因 为 它 是 用 C 语 言 写 成 ， 所 以 它 有 效 地 提高 了 性 能 。 注 意 hotshot 重 点 解决 了 性 能 测 
试 过 载 的 问题 ， 但 却 需要 更 多 的 时 间 来 生成 结果 。Python2.5 版 修复 了 hotshot 模 块 的 一 个 关于 
时 间 计 量 的 严重 pug。 


cProfile 模 块 是 Python2.5 新 增 的 ， 它 用 来 替换 掉 已 经 有 历史 的 hotshot 和 profile 模 块 。 作 者 已 确 
认 的 它 的 一 个 较 明 显 的 缺点 是 它 需 要 花 较 长 时 间 从 日 志文 件 中 载 入 分 析 结 果 ， 不 支持 子 函 数 
状态 细节 及 某 些 结果 不 准 。 它 也 是 用 C 语 言 来 实现 的 。 


3.8 练习 
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3-1. 标 识 符 。 为 什么 Python 中 不 需要 变量 名 和 变量 类 型 声明 ? 
3-2. 标 识 符 。 为 什么 Python 中 不 需要 声明 函数 类 型 ? 

3-3. 标 识 符 。 为 什么 应 当 避 免 在 变量 名 的 开始 和 和 结尾 使 用 双 下 划 线 ? 
3-4. 语 句 。 在 Python 中 一 行 可 以 书写 多 个 语句 吗 ? 


3-5. 语 句 。 在 Python 中 可 以 将 一 个 语句 分 成 多 行书 写 吗 ? 


(a) 赋值 语句 x，y，Z=1，2，3 会 在 x、y、z 中 分 别 赋 什么 值 ? 
(b) 执行 z，x，y=y，zZ，X 后 ，x、y、z 中 分 别 含 有 什么 值 ? 


3-7. 标 识 符 。 下 面 哪些 是 Python 合法 的 标识 符 ? 如 果 不 是 ， 请 说 明理 由 。 在 合法 的 标识 
符 中 ， 哪 些 是 关键 字 ? 


int32 40XL $aving$ printf print 
print this self . name Ox40L 
bool true big-daddy 2hot2touch type 
thisIsn'tAVar thisIsAVar R.U Ready Int True 
if do counter-1 access 


下 面 的 问题 涉及 了 makeTextFile.py 和 readTextFile.py 脚 本 。 
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3-8.Python 人 代码。 将 脚本 拷贝 到 你 的 文件 系统 中 ， 然 后 修改 它 。 可 以 添加 注释 ， 修 改 提 
示 符 (SAAT) 等 ， 修 改过 些 代码 ， 使 它 看 上 去 更 舒服 。 


3-9. 移 植 。 如 果 你 在 不 同类 型 的 计算 机 系统 中 分 别 安装 有 Python， 检 查 一 下 ，os.linesep 
的 值 是 否 有 不 同 。 记 下 操作 系统 的 类 型 及 linesep 的 值 。 


3-10. 异 常 。 使 用 类 似 readTextFile.py 中 异常 处 理 的 方法 取代 readTextFile.py 
makeTextFile.py 中 对 os.path.exists() 的 调用 。 反 过 来 ， 用 os.path.exists() 取 代 
readTextFile.py 中 的 异常 处 理 方 法 。 


3-11. 字 符 事 格式 化 不 再 抑制 readTextFile.py 中 print 语 名 生成 的 NEWLINE 字 符 ,修改 你 的 代 
码 ， 在 显示 一 行 之 前 删除 每 行 末尾 的 空白 。 这 样 ， 你 就 可 以 移 除 print 语 多 末尾 的 运 号 
了 。 提 示 : 使 用 字符 囊 对 象 的 strip() 方 法 。 


3-12. 合 并 源 文件 。 将 两 段 程序 合并 成 一 个 ， 给 它 起 一 个 你 喜欢 的 名 字 ， 比 如 
readNwriteTextFiles.py。 让 用 户 自己 选择 是 创建 还 是 显示 一 个 文本 文件 。 


3-13.* 添 加 新 功能 。 将 你 上 一 个 问题 改造 好 的 readNwriteTextFiles.py 增 加 一 个 新 功能 : 允 

许 用 户 编辑 一 个 已 经 存在 的 文本 文件 。 你 可 以 使 用 任何 方式 ， 无 论 是 一 次 编辑 一 行 ， 还 

是 一 次 编辑 所 有 文本 。 需 要 提醒 一 下 的 是 ， 一 次 编辑 全 部 文本 有 一 定 难度 ， 你 可 能 需要 

借助 GUI 工具 包 或 一 个 基于 屏幕 文本 编辑 的 模块 比如 curses 模 块 。 要 允许 用 户 保存 他 的 修 
改 (保存 到 文件 ) 或 取消 他 的 修改 〈 不 改变 原始 文件 ) ， 并 且 要 确保 原始 文件 的 安全 性 
(不 论 程 序 是 否 正常 关闭 ) 。 
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第 4 章 ”Python 对 象 


本 章 主题 

4 Python* & 

4 内 建 类 型 

e 标准 类 型 操作 符 
4 值 的 比较 

€ 对象 身 份 比较 
4 布尔 类 型 


4 各 种 类 型 
€ 不 支持 的 类 型 


我 们 现在 来 学 习 Python 语 言 的 核心 部 分 。 首 先 我 们 来 了 解 什么 是 Python 对 象 ， 然 后 讨论 最 常 
用 的 内 建 类 型 ， 接 下 来 我 们 讨论 标准 类 型 操作 符 和 内 建 函 数 ,之 后 给 出 对 标准 类 型 的 不 同 的 分 
类 方式 。 这 有 助 于 我 们 更 好 地 理解 他 们 如 何 工 作 。 最 后 我 们 会 提 到 Python 目前 还 不 支持 的 类 
型 (这 对 那些 有 其 他 高 级 语言 经 验 的 人 会 有 所 帮助 ) . 
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Python 使 用 对 象 模型 来 存储 数据 。 构 造 任 何 类 型 的 值 都 是 一 个 对 象 。 尽 管 Python 通常 被 当成 
一 种 “面向 对 象 的 编程 语言 "， 但 你 完全 能 够 写 出 不 使 用 任何 类 和 实例 的 实用 脚本 。 不 过 Python 
的 对 象 语法 和 架构 鼓励 我 们 使 用 这 些 特性 ， 下 面 让 我 们 仔细 研究 一 下 Python 对 象 。 


所 有 的 Python 对 像 都 拥有 三 个 特性 : 身份 ， 类 型 和 值 。 


身份 : 每 一 个 对 象 都 有 一 个 唯一 的 身份 标识 自己 ， 任 何 对 象 的 身份 可 以 使 用 内 建 函 数 id() 
来 得 到 。 这 个 值 可 以 被 认为 是 该 对 象 的 内 存 地 址 。 你 极 少 会 用 到 这 个 值 ， 也 不 用 太 关心 


CEREA 


类 型 : 对 象 的 类 型 决定 了 该 对 象 可 以 保存 什么 类 型 的 值 ， 可 以 进行 什么 样 的 操作 ， 以 及 

遵循 什么 样 的 规则 。 你 可 以 用 内 建 函 数 type() 查 看 Python 对 象 的 类 型 。 因 为 在 Python 中 类 
型 也 是 对 象 (还 记得 我 们 提 到 Python 是 面向 对 象 的 这 多 话 吗 ?) ， 所 以 type() 返 回 的 是 对 

象 而 不 是 简单 的 字符 串 。 


值 : 对 象 表示 的 数据 项 。 


上 面 三 个 特性 在 对 象 创建 的 时 候 就 被 赋值 ， 除 了 值 之 外 ， 其 他 两 个 特性 都 是 只 读 的 。 对 于 新 
式 类 型 和 类 ， 对 象 的 类 型 也 是 可 以 改变 的 ， 不 过 并 不 推荐 初学 者 这 样 做 。 


如 果 对 象 支持 更 新 操作 ， 那 么 它 的 值 就 可 以 改变 ， 和 否则 它 的 值 也 是 只 读 的 。 对 象 的 值 是 否 可 
以 更 改 被 称 为 对 象 的 可 改变 性 (mutability) ,我 们 会 在 后 面 的 4.7 小 节 中 讨论 这 个 问题 。 只 要 一 
个 对 象 还 没有 被 销 贷 ， 这 些 特性 就 一 直 存 在 。 


Python 有 一 系列 的 基本 〈 内 建 ) 数据 类 型 ， 必 要 时 也 可 以 创建 自 用 程 
序 的 需求 。 绝 大 多 数 应 用 程序 通常 使 用 标准 类 型 ， 对 特定 的 数据 存储 则 通过 创建 和 实例 化 类 
来 实现 。 


对 象 属性 


某 些 Python 对 象 有 属性 、 值 或 相关 联 的 可 执行 代码 ， 比 如 方法 method) o Python 用 句点 
(.) 标记 法 来 访问 属性 。 属 性 包括 相应 对 象 的 名 字 等 ， 在 2.14 小 节 中 曾 做 过 介绍 。 最 常用 的 
属性 是 函数 和 方法 ， 不 过 有 一 些 Python 类 型 也 有 数据 属性 。 含 有 数据 属性 的 对 象 包括 (但 不 
限于 ) : 类 、 类 实例 、 模 块 、 复 数 和 文件 。 


4.2 标准 类 型 


e 数字 (分 为 几 个 子 类 型 ， 其 中 有 三 个 是 整 型 ) 
e Integer 整 型 

e Boolean 布 尔 型 

e Long integer 长 整 型 

e Floating point real number 浮 点 型 

e Complex number 复 数 型 

e String 字 符 串 


e [List 列表 


e Tuple 元 组 
e Dictionary X 


在 本 书 中 ， 标 准 类 型 也 称 作 " 基 本 数据 类 型 *， 因 为 这 些 类 型 是 Python 内 建 的 基本 数据 类 型 ， 我 
们 会 在 第 5 、 第 6 和 第 7 章 中 详细 介绍 它们 x 
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kè 


eX 
e Nulli €& (None) 

e x 

e 集合 /固定 集合 

e 函数 /方法 

e 模块 

eX 

这 些 是 当 你 做 Python 开发 时 可 能 会 用 到 的 一 些 数据 类 型 。 我 们 在 这 里 讨论 Type 和 None 类 型 的 
使 用 ， 除 此 之 外 的 其 他 类 型 将 在 其 他 章节 中 讨论 。 
4.3.1 XH X X fetype2 7H 


在 本 章 我 们 要 讨论 所 有 的 Python 类 型 ， 虽 然 看 上 去 把 类 型 本 身 也 当成 对 象 有 点 特别 ， 我 们 还 
是 要 在 这 里 提 一 提 。 你 一 定 还 记得 ， 对 象 的 一 系列 国有 行为 和 特性 (比如 支持 哪些 运算 ， 具 
有 哪些 方法 ) 必须 事先 定义 好 。 从 这 个 角度 看 ， 类 型 正 是 保存 这 些 信 息 的 最 佳 位 置 。 描 述 一 
种 类 型 所 需要 的 信息 不 可 能 用 一 个 字符 串 来 搞定 ， 所 以 类 型 不 能 是 一 个 简单 的 字符 串 ， 这 些 
言 息 不 能 也 不 应 该 和 数据 保存 在 一 起 ， 所 以 我 们 将 类 型 定义 成 对 象 。 

下 面 我 们 来 正式 介绍 内 建 函 数 type()。 通 过 调用 type() 函 数 你 能 够 得 到 特定 对 象 的 类 型 信息 。 

>> type (42) 
«type ‘int'> 


我 们 仔细 研究 一 下 这 个 例子 ， 请 注意 看 type 函 数 有 趣 的 返回 值 。 我 们 得 到 一 个 简洁 的 输出 结果 
<type'int>。 不 过 你 应 当 意 识 到 它 并 不 是 一 个 简单 地 告诉 你 42 是 个 整 型 的 字符 串 。 你 看 到 的 
<type'int > 实际 上 是 一 个 类 型 对 象 ， 碰 巧 它 输出 了 一 个 字符 串 来 告诉 你 它 是 个 int 型 对 象 。 


现在 你 该 问 自己 了 ， 那 么 类 型 对 象 的 类 型 是 什么 ? 来 ， 我 们 试验 一 下 。 


>>type (type (42) ) 


«type type > 


没 错 ， 所 有 类 型 对 象 的 类 型 都 是 type, 它 也 是 所 有 Python 类 型 的 根 和 所 有 Python 标准 类 的 默认 
元 类 (metadass) 。 你 现在 有 点 搞 不 明白 ， 没 关系 ， 随 着 我 们 逐步 深入 地 学 习 类 和 类 型 ， 你 
就 会 慢 慢 理解 。 

随 着 Python 2.2 中 类 型 和 类 的 统一 ， 类 型 对 象 在 面向 对 象 编程 和 日 常 对 象 使 用 中 扮演 着 更 加 重 


要 的 角色 。 从 现在 起 ， 类 就 是 类 型 ， 实 例 是 对 应 类 型 的 对 象 。 


4.3.2 None 一 一 Python 的 Nullsi £ 


Python 有 一 个 特殊 的 类 型 ， 被 称 为 Null 对 象 或 者 NoneType, 它 只 有 一 个 值 ， 那 就 是 None。 它 
不 支持 任何 运算 也 没有 任何 内 建 方法 。 如 果 非 常熟 悉 C 语 言 ， 就 会 知道 和 None 类 型 最 接近 的 C 
类 型 就 是 void, None 类 型 的 值 和 C 的 NULL 值 非常 相似 (其 他 类 似 的 对 象 和 值 包 括 Perl 的 undef 
和 Java 的 void 类 型 和 null 值 ) 。 


None 没 有 什么 有 用 的 属性 ， 它 的 布尔 值 总 是 False 。 


核心 笔记 : 布尔 值 


所 有 标准 对 象 均 可 用 于 布尔 测试 ， 同 类 型 的 对 象 之 间 可 以 比较 大 小 。 每 个 对 象 天 生 具 有 布尔 
True 或 False 值 。 空 对 象 、 值 为 零 的 任何 数字 或 者 Null 对 象 None 的 布尔 值 都 是 False。 


下 列 对 象 的 布尔 值 是 False。 
e None; 
。 False (布尔 类 型 ) 
e 所 有 的 值 为 零 的 数 ; 

) 


e 0.0 ( 浮 点 型 ) 


。 0 (#4 


k 


e OL (长 整 型 ) 

e 0.0+0.0j (复数 ) 
。“”( 空 字符 串 ) 

e [] (ŻAR) 


e () ( 空 元 组 ) 


AE ( 空 字 典 ) o 


值 不 是 上 面 列 出 来 的 任何 值 的 对 象 的 布尔 值 都 是 True, 例 如 non-empty、non-zero 等 。 用 户 创 
建 的 类 实例 如 果 定 义 了 nonzero (nonzero_()) 或 length ( len ()) 且 值 为 0, 那 么 它们 
的 布尔 值 就 是 False。 


4.4 内 部 类 型 
e 代码 
e db 
e 跟踪 记录 
e 切片 
e 省 略 
e Xrange 


Aue 里 简要 介绍 一 下 这 些 内 部 类 型 ， 一 般 的 程序 员 通 常 不 会 直接 和 这 些 对 象 打交道 。 不 
过 为 了 这 一 章 的 完整 性 ， 我 们 还 是 在 这 里 介绍 一 下 它们 。 请 参阅 源 代码 或 者 Python 的 内 部 文 
档 和 在 线 文档 来 获得 更 详尽 的 信息 。 


你 如 果 对 异常 感到 迷惑 的 话 ， 可 以 告诉 你 它们 是 用 类 来 实现 的 。 在 老 版 本 的 Python 中 ， 异 常 
是 用 字符 串 来 实现 的 。 


4.4.1 代码 对 象 


A 象 是 编译 过 的 Python 源 代码 片段 ， 它 是 可 执行 对 象 。 通 过 调用 内 建 函 数 compile() 可 以 
得 到 代码 对 象 。 代 码 对 象 可 以 被 exec 命 令 或 eval() 内 建 函 数 来 执行 。 在 第 14 章 将 详细 研究 代码 
对 象 。 


代码 对 得 本 身 不 包含 任何 执行 环境 信息 ， 它 是 用 户 自 定义 函数 的 核心 ， 在 被 执行 时 动态 3 
上 下 文 。 (事实 上 代码 对 象 是 函数 的 一 个 属性 ) 一 个 函数 除了 有 代码 对 象 属 性 以 外 ,i iini 此 
其 他 函数 必须 的 属性 ， 和 包括 函 数 名 、 文 档 字 符 串 、 上 默认 参数 、 及 全 局 命名 空间 等 。 


44.2 Wu 


帧 对 象 表示 Python 的 执行 栈 帧 。 帧 对 象 包含 Python 解释 器 在 运行 时 所 需要 知道 的 所 有 信息 。 
它 的 属性 包括 指向 上 一 帧 的 链接 ， 正 在 被 执行 的 代码 对 象 (参见 上 文 ) ， 本 地 及 全 局 名 称 空 
间 字 典 及 当前 指令 等 。 每 次 函数 调用 产生 一 个 新 的 帧 ， 每 一 个 帧 对 象 都 会 相应 创建 一 个 C 栈 
帧 。 用 到 帧 对 象 的 一 个 地 方 是 跟踪 记录 对 人 象 。 


4.4.3 跟踪 记录 对 象 
当 你 的 代码 出 错时 ，Python 就 会 引发 一 个 异常 。 如 果 弄 常 未 被 捕获 和 处 理 ， 解 释 器 就 会 退出 
脚本 运行 ， 显 示 类 似 下 面 的 诊断 信息 。 
Traceback (innermost last): 
File "«stdin»", line N?, in ??? 


ErrorName: error reason 


当 异 常 发 生 时 ， 一 个 包含 针对 异常 的 栈 跟 踪 信 息 的 跟踪 记录 对 象 被 创建 。 如 果 一 个 异常 有 自 
己 的 处 理 程序 ， 处 理 程序 就 可 以 访问 这 个 跟踪 记录 对 象 。 


444 切片 对 象 


当 使 用 Python 扩展 的 切片 语法 时 ,就 会 创建 切片 对 象 。 扩 展 的 切片 语法 允许 对 不 同 的 索引 切片 
操作 ， 包 括 步 进 切片 、 多 维 切 片 和 省 略 切片 。 多 维 切片 语法 是 sequence[startl :endl > start2 : 
end2], 或 使 用 省 略 号 ，sequence[...，startl : end1 ]。 切 片 对 象 也 可 以 由 内 建 函 数 slice() 来 生 
成 。 步 进 切 片 允 许 利用 第 3 个 切片 元 素 进 行 步 进 切片 ， 它 的 语法 为 Sequence[ 起 始 索引 : 结束 
索引 : 步 进 值 ]。Python 很 早 就 支持 扩展 步 进 切片 语法 了 ， 但 直到 Python2.3 以 前 都 必须 依靠 C 
语言 的 API 或 Jython 才 能 工作 。 下 面 是 几 个 步 进 切片 的 例子 。 

>>> foostr = 'abcde' 

»»» foostr[::-1] 

'edcba' 

»»» foostr[::-2] 

'eca' 
s55 foolist = [123, 'xba', 342.23, "'abc'] 
>>>. foolist[::-1] 


['abo', 342,23, 'xba', T23) 


44.5 省 略 对 象 


省 略 对 象 用 于 扩展 切片 语法 中 ， 起 记号 作用 。 这 个 对 象 在 切片 语法 中 表示 省 略 号 。 类 似 Null 对 
象 None, 省 略 对 象 有 一 个 唯一 的 名 字 Ellipsis, 它 的 布尔 值 始终 为 True 。 


4.4.6 XRange £ 


调用 内 建 函 数 xrange() 会 生成 一 个 Xrange 对 象 ，xrange() 是 内 建 函 数 range() 的 兄弟 版 本 ， 用 于 
需要 节省 内 存 使 用 或 range() 无 法 完成 的 超大 数据 集 场 合 。 在 第 8 章 你 可 以 找到 更 多 关于 
range() 和 xrange() 的 使 用 信息 。 


4.5 标准 类 型 操作 符 


4.5.1 对 象 值 的 比较 


比较 操作 符 用 来 判断 同类 型 对 象 是 否 相 等 ， 所 有 的 内 建 类 型 均 支持 比较 运算 ， 比 较 运 算 返 回 
布尔 值 True 或 False。 如 果 你 正在 使 用 的 是 早 于 Python2.3 的 版 本 ， 因 为 这 些 版 本 还 没有 布尔 
类 型 ， 所 以 会 看 到 比较 结果 为 整 型 值 { (代表 True) XO (代表 False) 。 


注意 ， 实 际 进行 的 比较 运算 因 类 型 而 异 。 换 言 之 ， 数 字 类 型 根据 数值 的 大 小 和 符号 比较 ， 字 


符 串 按照 字符 序列 值 进 行 比较 ， 等 等 。 


True 

So [$, TAGET] == [*'abe*,. 3] 
False 

20» [3, 'abc'] == [3, 'abüü'] 
True 


不 同 于 很 多 其 他 语言 ， 多 个 比较 操作 可 以 在 同一 行 上 进行 ， 求 值 顺序 为 从 左 到 右 。 


eo gx aT *$ same as (3«4) and (4 «7 ) 


>>> 4 > 3 == 3 # same as ( 4 > 3 ) and ( 3 == 3) 
True 

pr > HN «€ 3 «€ E 2. «7 

False 


我 们 会 注意 到 比较 操作 是 针对 对 象 的 值 进行 的 ， 也 就 是 说 比较 的 是 对 象 的 数值 而 不 是 对 象 本 
身 。 在 后 面 的 部 分 我 们 会 研究 对 象 身份 的 比较 。 












W 4.1 标准 类 型 值 比较 操作 符 
"M | 功 fe 
exprl < expe? | expr! 小 于 expe 
expri > expr2 expel KF exp 

































m expel €» expr2 小 于 等 于 expr2 
expel >= expr? expel. KEYF exp 
expel expe? expri YF exp? 
expel in expe2 expri 不 等 于 expr? CC 风格 ) 








expri CABC/Pascal US ) 





不 等 于 expe2 


未 来 很 有 可 能 不 再 支持 <> 操 作 符 ， 建 议 你 一 直 使 用 != 操 作 符 


4.5.2 ”对象 身份 比较 


作为 对 值 比较 的 补充 ，Python 也 支持 对 象 本 身 的 比较 。 对 象 可 以 被 赋值 到 另 一 个 变量 〈 通 过 
引用 ) 。 因 为 每 个 变量 都 指向 同一 个 (共享 的 ) 数据 对 象 ， 只 要 任何 一 个 引用 发 生 改 变 ， 该 
对 象 的 其 他 引用 也 会 随 之 改变 。 


为 了 方便 大 家 理解 ， 最 好 先 别 考虑 变量 的 值 ， 而 是 将 变量 名 看 作对 象 的 一 个 链接 。 让 我 们 来 
看 以 下 三 个 例子 : 


例 1: foo1 和 foo2 指 向 相同 的 对 象 
foo1 = foo2 = 4.3 


你 从 值 的 观点 看 这 条 语句 时 , 它 表现 的 只 是 一 个 多 重 赋值 ， 将 4.3 这 个 值 赋 给 了 fool 和 foo2 这 
EE 量 。 这 当然 是 对 的 ， 不 过 它 还 有 另 一 层 含义 。 事 实 是 一 个 值 为 4.3 的 数字 对 象 被 创建 ， 
然后 这 个 对 象 的 引用 被 赋值 给 fool 和 foo2, 结 果 就 是 fool 和 foo2 指 向 同一 个 对 象 。 图 4-1 演 示 了 一 
个 对 象 两 个 引用 。 


fool 


Mine. 9e 
foo2 ee 


4-1 foo1 和 foo2 指 向 相同 的 对 象 





例 2: foo1 和 foo2 指 向 相同 的 对 象 
foo1 = 4.3 
foo2 = foo1 


这 个 例子 非常 类 似 上 一 个 ， 一 个 值 为 4.3 的 数值 对 vada 1 建 ， 然 后 赋 给 一 个 变量 ， 当 执行 foo2 
= foo1 时 ，foo2 被 指向 foo1 所 指向 的 同一 个 对 象 ， 这 是 因为 Python 通过 传递 引用 来 处 理 对 象 。 
foo2 就 成 为 原始 值 4.3 的 一 个 新 的 引用 。 这 样 foo1 和 foo2 就 都 指向 了 同一 个 对 象 。 示 意图 也 和 
图 4-1 一 样 。 


例 3: fool 和 foo2 指 向 不 同 的 对 象 
foo1 = 4.3 
foo2 = 1.3 + 3.0 


这 个 例子 有 所 不 同 。 首 先 一 个 数字 对 象 被 创建 ， 然 后 赋值 给 foo1。 然 后 第 二 个 数值 对 象 被 创 
建 并 赋值 给 foo2。 尽 管 两 个 对 象 保存 的 是 同样 大 小 的 值 ， 但 事实 上 系统 中 保存 的 都 是 两 个 独 
立 的 对 象 ， 其 中 foo1 是 第 一 个 对 象 的 引用 ，foo2 则 是 第 二 个 对 象 的 引用 。 图 4-2 演 示 给 我 们 这 
里 有 两 个 不 同 的 对 象 ， 尽 管 这 两 个 对 象 有 同样 大 小 的 数值 。 我 们 为 什么 在 示意 图 中 使 用 盒 

子 2 没 错 ， 对 象 就 像 一 个 装着 内 容 的 盒子 。 当 一 个 对 象 被 典 值 到 一 个 变量 ， 就 像 在 这 个 盒子 
上 贴 了 一 个 标签 ， 表 示 创 建 了 一 个 引用 。 每 当 这 个 对 象 有 了 一 个 新 的 引用 ， 就 会 UE 


贴 一 张 标 签 。 当 一 个 引用 被 销毁 时 ， bic 当 所 有 的 标签 都 被 撕 掉 时 ， 
盒子 就 会 被 回收 。 那 么 ，Python 是 怎么 知道 这 个 盒子 有 多 少 个 标签 呢 ? 
a A A 
0 Bu 4.3 


4-2 foo1 和 foo2 指 向 不 同 的 对 象 


每 个 对 象 都 天 生 具 有 一 个 计数 器 ， 记 录 它 自己 的 引用 次 数 。 这 个 数目 表示 有 多 少 个 变量 指向 
该 对 象 。 这 也 就 是 我 们 在 3.5.5 一 3.5.7 小 节 提 到 的 引用 计数 。Python 提 供 了 is 和 is not 操 作 符 
来 测试 两 个 变量 是 否 指向 同一 个 对 象 。 像 下 面 这 样 执行 一 个 测试 。 


aisb 
这 个 表达 式 等 价 于 下 面 的 表达 式 。 
id (a) == id (b) 


对 象 身 份 比较 操作 符 拥有 同样 的 优先 级 ， 表 4.2 列 出 了 这 些 操作 符 。 在 下 面 这 个 例子 里 ， 我 们 
创建 了 一 个 变量 ， 然 后 将 第 二 个 变量 指向 同一 个 对 象 。 


205 a = | 5, Thart"; 9:3] 
2590 D a 

>>> ais D 

True 

25» a is not b 
False 

222 

>>> D = 2.56-5 
>>> D 

Z: 36=005 

>>> a 

Sr aG 9.3] 
P220 E D 
False 

>>> a is mot D 
True 










操 作 符 
objl is obj2 
objl is mot obj2 








obil 和 obj2 是 同 个 对 象 
objl 和 obj2 不 是 同一 个 对 象 











核心 笔记 : 实践 


在 上 面 的 例子 中 ， 你 会 注意 到 我 们 使 用 的 是 浮 点 型 而 不 是 整 型 。 为 什么 会 这 样 ? 整 型 对 象 和 
字符 串 对 象 是 不 可 变 对 象 ， 所 以 Python 会 很 高 效 地 缓存 它们 。 这 会 造成 我 们 认为 Python 应 该 
创建 新 对 象 时 ， 它 却 没有 创建 新 对 象 的 假象 。 请 看 下 面 的 例子 。 


55 a S 1 


>>> 1da) 
8402824 
>>> b= 1 


>>> id(b) 
8402824 


555 
>>> cq = 1.0 
»»» LAC) 


8651220 

>>> g = 1.0 
>>> id(d) 
8651204 


EX A-2 Duthanan 44 Z ANA 
"4x Python X 104 


在 上 面 的 例子 中 ，a 和 b 指 向 了 相同 的 整 型 对 象 ， 但 是 c 和 d 并 没有 指向 相同 的 浮 点 型 对 象 。 如 
果 我 们 是 纯粹 主义 者 ， 我 们 会 希望 a 与 b 能 和 6 与 d 一 样 ， 因 为 我 们 本 意 就 是 为 了 创建 两 个 整 型 
对 象 ， 而 不 是 像 b = a 这 样 的 结果 。 


Python 仅 缓存 简单 整 型 ， 因 为 它 认为 在 Python 应 用 程序 中 这 些小 整 型 会 经 常 被 用 到 。 当 我 们 
在 写作 本 书 的 时 候 ，Python 缓 存 的 整 型 范围 是 (-1，100) ,不 过 这 个 范围 是 会 改变 的 ， 所 以 
请 不 要 在 你 的 应 用 程序 使 用 这 个 特性 。 


Python2.3 中 决定 ， 在 预定 义 缓存 字符 串 表 之 外 的 字符 串 ， 如 果 不 再 有 任何 引用 指向 它 ， 那 这 
个 字符 串 将 不 会 被 缓存 。 也 就 是 说 ， 被 缓存 的 字符 串 将 不 会 像 以 前 那样 永生 不 灭 ， 对 象 回收 
器 一 样 可 以 回收 不 再 被 使 用 的 字符 串 。 从 Python 1.5 起 提供 的 用 于 缓存 字符 的 内 建 函数 
intern() 也 已 经 不 再 推荐 使 用 ， 即 将 被 废弃 。 


4.5.3 布尔 类 型 


布尔 逻辑 操作 符 and、or 和 not 都 是 Python 关 键 字 , 这 些 操作 符 的 优先 级 按 从 高 到 低 的 顺序 列 于 
表 4.3。not 操 作 符 拥有 最 高 优先 级 ， 只 比 所 有 比较 操作 符 低 一 级 。and 和 or 操作 符 则 相应 地 再 
低 一 级 。 

















X43 pk SER REST 
H t oS 功 E 
not expr m g expe (38 99. (7) 
a expri and expr2 | expri 和 expe2 的 还 辑 与 I 
i expri ere | expr] 和 m pg 


»»» x, y = 3.1415926536, -1024 

sS e X Dp 

True 

»»» NOt (x € 5.0) 

False 

>> (* € 5.0) OE (y > 2.,71898291829) 
True 

>>> (x < 5.0) and (y > 2.719281828) 
False 

>>> not (x is y) 


True 


前 面 我 们 提 到 过 Python 支持 一 个 表达 式 进 行 多 种 比较 操作 ， 其 实 这 个 表达 式 本 质 上 是 由 多 个 
隐 式 的 and 连 接 起 来 的 多 个 表达 式 。 


»»» «4 €7 855"( 3« 4 ) and ( 4 « 7? 1)"— 样 


True 


4.6 JIEXMPEÓS&E 


除了 这 些 操作 符 ， 我 们 刚才 也 看 到 ，Python 提 供 了 一 些 内 建 函 数 用 于 这 些 基 本 对 象 类 型 : 
cmp()、repr()、str()、type() 和 等 同 于 repr() 函 数 的 单反 引号 (7). 操作 符 。 























X44 标准 类 型 内 建 函 数 
函数 | 功 能 
cmp(objl, obj2) | 比较 objl 和 obj2, 根据 比较 结果 返回 整 型 i 
i<0ifobjl <obj2 
i>0ifobjli > obj2 
i 0 if objl * obj2 
repr(obj) W ‘obj | ik EI— T4 2.07 0 O8 
str(obj) ik eH $36 5 run yp 46s 
type(obj) 得 到 一 个 对 象 的 类 型 ， 并 返回 相应 的 type NW 





4.6.1 type() 


313148 AGE AA 28type() » JE Python2.274 31 > type();& AE AC o» TEUM’ CEAT 
一 个 “工厂 函数 <。 在 本 章 的 后 面部 分 我 们 会 讨论 工厂 函数 ， 现 在 你 仍然 可 以 将 type() 仅 仅 当 成 
一 个 内 建 防 数 来 看 。type() 的 用 法 如 下 。 

type (object) 

type() 接 受 一 个 对 象 作 为 参数 ， 并 返回 它 的 类 型 。 它 的 返回 值 是 一 个 类 型 对 象 。 


>>> type(4) YH 


<type 'int'> 


>>> 
>>> type('Hello World!') # 字符 型 
«type 'string'» 

>>> 

>>> type(type(4)) # 上 tyYpe 类 型 


«type 'type'» 


在 上 面 的 例子 里 ， 我 们 通过 内 建 函 数 type() 得 到 了 一 个 整 型 和 一 个 字符 串 的 类 型 ; 为 了 确认 一 
下 类 型 本 身 也 是 类 型 ， 我 们 对 type() 的 返回 值 再 次 调用 type()。 注 意 type() 有 趣 的 输出 ， 它 看 上 
去 不 像 一 个 典型 的 Python 数据 类 型 ， 比 如 一 个 整 型 或 一 个 字符 串 ， 一 些 东 西 被 一 个 大 于 号 和 


一 个 小 号 包 庄 着 。 这 种 语法 是 为 了 告诉 你 它 是 一 个 对 象 。 每 个 对 象 都 可 以 实现 一 个 可 打印 的 
字符 串 表 示 。 不 过 并 不 总 是 这 样 ， 对 那些 不 容易 显示 的 对 象 来 说 ，Python 会 以 一 个 相对 标准 
的 格式 表示 这 个 对 象 ， 格 式 通常 是 这 种 形式 : «object something_or_another>, 以 这 种 形式 
显示 的 对 象 通常 会 提供 对 象 类 别 、 对 象 jd 或 位 置 ， 或 者 其 他 合适 的 息 。 


4.6.2 cmp() 


内 建 防 数 cmp() 用 于 比较 两 个 对 象 objl 和 obj2。 如 果 obj1. 小 于 obj2, 则 返回 一 个 负 整 型 ， 如 果 
obj1 大 于 obj2 则 返回 一 个 正 整 型 ， 如 果 obj1 等 于 obj2, 则 返回 0 。 它 的 行为 非常 类 似 于 C 语 言 的 
strcmp() 函 数 。 比 较 是 在 对 象 之 问 进行 的 ， 不 管 是 标准 类 型 对 象 还 是 用 户 自 定义 对 象 。 如 果 是 
用 户 自 定义 对 象 ，cmp() 会 调用 该 类 的 特殊 方 0。 在 第 13 章 会 详细 介绍 类 的 这 些 特殊 方法 。 下 
面 是 几 个 使 用 cmp() 内 建 函 数 的 对 数值 和 字符 串 对 象 进行 比较 的 例子 。 


s»» L592695365 =1024 
> 

True 

>>> not (x € 5.0) 

False 

2»» (x < 5.0) © (v > 2.718291929) 
True 

>>> (x < 5,0) and (v > 2.719281528) 
False 

>>> not (x is y) 


True 


在 后 面 我 们 会 研究 cmp() 用 于 其 他 对 象 的 比较 操作 。 


4.6.3 str() 和 repr() (及 操作 符 ) 


内 建 函 数 str) 和 repr() 或 反 引 号 操作 符 (7) 可 以 方便 地 以 字符 囊 的 方式 获取 对 象 的 内 容 、 类 
型 、 数 值 属性 等 信息 。str() 函 数 得 到 的 字符 囊 可 读 性 好 ， 而 repr() 函 数 得 到 的 字符 串通 常 可 以 
用 来 重新 获得 该 对 象 ， 通 常情 况 下 0bj==eval (repr (obj) ) 这 个 等 式 是 成 立 的 。 这 两 个 函数 
接受 一 个 对 象 作为 其 参数 ， 返 回 适当 的 字符 串 。 在 下 面 的 例子 里 ， 我 们 会 随机 取 一 些 Python 
对 象 来 查看 他 们 的 字符 串 表 示 。 


2»» str(4.53-21) 
*(4,53-231) ' 

>>> 

525» stril) 

EE 

>>> 

»»» str(2e10) 
'20000000000.0' 
> 

zS SETI [O07 52 9; 
"[D, S, 9, 3I" 
>>> 


32» repr([0, 9, 9, 


"EU Sk». 31" 
22» 


"[9, 9, 9, 9I” 


3] ) 


9]) 


尽管 str()，repr() 和 、、 运 算 在 特性 和 功能 方面 都 非常 相似 ， 事 实 上 repr() 和 “做 的 是 完全 一 样 
的 事情 ， 它 们 返回 的 是 一 个 对 象 的 “官方 “字符 串 表 示 ， 也 就 是 说 绝 大 多 数 情况 下 可 以 通过 求 值 
运算 (使 用 内 建 函 数 eval()) 重新 得 到 该 对 象 ， 但 str() 则 有 所 不 同 。str() 致 力 于 生成 一 个 对 象 
的 可 读 性 好 的 字符 串 表 示 ， 它 的 返回 结果 通常 无 法 用 于 eval() 求 值 ,但 很 适合 用 于 print 语 句 输 
出 。 需 要 再 次 提醒 的 是 ,并 不 是 所 有 repr() 返 回 的 字符 串 都 能 够 用 eval() 内 建 函 数 得 到 原来 的 对 


象 。 


>>> eval( type(type)) ^) 
File "«stdin»", line 1 


eval(' type(type))") 


^ 


SyntaxError: invalid syntax 


也 就 是 说 repr() 输 出 对 Python 比较 友好 ， 而 str() 的 输出 对 用 户 比 较 友 好 。 虽 然 如 此 ， 很 多 情况 
这 三 者 的 输出 仍然 都 是 完全 一 样 的 。 


核心 笔记 : 为 什么 我 们 有 了 repr () 还 需要 `…? 


在 Python 学 习 过 程 中 ， 你 偶尔 会 遇 到 某 个 操作 符 和 某 个 函数 是 做 同样 一 件 事 情 。 之 所 以 如 此 
是 因为 茶 些 场合 函数 会 比 操作 符 更 适合 使 用 。 举 个 例子 ， 当 处 理 类 似 函 数 这 样 的 可 执行 对 银 
或 根据 不 同 的 数据 项 调用 不 同 的 函数 处 理 时 ， 了 有 函数 就 比 操作 符 用 起 来 方便 。 另 一 个 例子 就 是 
双星 号 (** ) 乘 方 运算 和 pow() 内 建 函 数 ，x*y 和 pow (X，y) 执行 的 都 是 X 的 y 次 方 ( 译 者 
ik: 事实 上 Python 社 区 目前 已 经 不 鼓励 继续 使 用 ** 操 作 符 。 这 是 本 书 成 书 之 后 的 变化 ) 。 


4.6.4 type() 和 isinstance() 


Python 不 支持 方法 或 函数 重 载 ， 因 此 你 必须 自己 保证 调用 的 就 是 你 想 要 的 函数 或 对 象 。 幸 运 
的 是 ， 我 们 前 面 4.3.1 小 节 提 到 的 type() 内 建 函 数 可 以 帮助 你 确认 这 一 点 。 一 个 名 字 里 究 竟 保 存 
的 是 什么 ?相当 多 ， 尤 其 是 这 是 一 个 类 型 的 名 字 时 。 确 认 接 收 到 的 类 型 对 象 的 身份 有 很 多 时 
候 都 是 很 有 用 的 。 为 了 达到 此 目的 ，Python 提 供 了 OU 建 函 数 type()。type() 返 回 任意 
Python 对 象 的 类 型 ， 而 不 局 限于 标准 类 型 。 让 我 们 通过 交互 式 解释 器 来 看 几 个 使 用 type() 内 建 
函数 返回 多 种 对 象 类 型 的 例子 


o ^A 
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>>> type('') 
«type 'str'» 
>>> 

>>> 3 = 'xyz' 
>>> type(s) 
<type 'str'> 
>>> 

>>> type(100) 
<type 'int'> 
>>> type (0+0j) 
<type 'complex'> 
>>> type (0L) 
«type 'long'» 
»»» type(0.0) 
«type 'float'» 
>>> 

>>> type([]1) 
«type 'list'» 
>>> type(()) 
«type 'tuple'» 
>>> type(i)) 
«type 'dict'» 
»»» type(type) 
«type 'type'» 
>>> 

>>> class Foo: pass 


>>> foo = Foot) 


»»» class Bar(object): pass 


»»» bar * Bar() 
>>> 


>>> type(Foo) 

«type 'classobj'» 

»»» type(foo) 

«type 'instance'» 

>>> type(Bar) 

«type 'type'» 

»»» type(bar) 

«class ' main, .Bar'» 


$ new-style class 


& new-style class 


Python2.2 统 一 了 类 型 和 类 ， 如 果 你 使 用 的 是 低 于 Python2.2 的 解释 器 ， 你 可 能 看 到 不 一 样 的 


输出 结果 。 
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>>> type('') 

«type 'string'» 

>>> type (0L) 

«type 'long int'> 

>>> type((]) 

«type 'dictionary'» 

>>> type(type) 

«type 'builtin function or method'» 

>>> 

>>> type(Foo) # assumes Foo created as in above 
«type 'class'» 

>>> type(foo) # assumes foo instantiated also 


«type 'instance'» 


除了 内 建 函 数 type(), 还 有 一 个 有 用 的 内 建 函 数 叫做 isinstance()。 我 们 会 在 第 13 章 (面向 对 象 
编程 ) 正式 研究 这 个 函数 ， 不 过 在 这 里 我 们 还 是 要 简要 介绍 一 下 如 何 利用 它 来 确认 一 个 对 象 
的 类 型 。 


1.2545] 


4514.1 P ALIE T — BOB GR SUR dE ETT HIST Flisinstance()fetype() Rir » 5 A] 
讨论 type() 的 使 用 ， 以 及 怎么 将 这 个 例子 移植 为 改 用 isinstance() 。 


运行 typechk.py， 我 们 会 得 到 以 下 输出 。 


-69 is a number of type: int 
9999999999999999999999 is a number of type: long 
98.6 is a number of type: float 

(-5.2*1.93) is a number of type: complex 


xxx is not a number at all!! 


44.1 检查 类 型 〈typechk.py ) 


函数 displayNumType() 接 受 一 个 数值 参数 ， 它 使 用 内 建 函 数 type() 来 确认 数值 的 类 型 (或 不 是 
一 个 数值 类 型 ) 。 
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#1/usr/bin/env python 


def displayNumType (num) : 


print num, 'ís', 
print 'a number of type:', type(num). name . 


else: 


1 
2 
3 
E 
5 if isinstance(num, (int, long, float, complex)): 
6 
7 
8 print 'not a number at all!!'*' 

9 


10 displayNumType(-69) 

11 displayNumType (99999999999999999999991.) 
12 displayNumType (98.6) 

13 displayNumType(-5.241.91) 

14 displayNumType ('xxx') 


2. 例 子 进 阶 
(1) 原始 
这 个 完成 同样 功能 的 函数 与 本 书 的 第 一 版 中 的 例子 已 经 大 不 相同 。 


def displayNumType (num): 
print num, "is", 
if type(num) == type(0): 
print 'an integer' 

elif type(num) == type (0L): 
print 'a long' 

elif type (num) == type(0.0): 
print 'a float' 

elif type(num) == type (0+0j): 
print 'a complex number' 

else: 


print 'not a number at all!!' 


由 于 Python 奉行 简单 但 是 比较 慢 的 方式 ， 所 以 我 们 必须 这 么 做 ， 看 一 眼 我 们 原来 的 条 件 表达 
AX: 


if type(num) == type(0)... 


(2) 减少 函数 调用 的 次 数 
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如 果 我 们 仔细 研究 一 下 我 们 的 代码 ， 会 看 到 我 们 调用 了 两 次 type()。 要 知道 每 次 调用 函数 都 会 
付出 性 能 代价 ， 如 果 我 们 能 减少 函数 的 调用 次 数 ， 就 会 提高 程序 的 性 能 。 


人 o ad A ， 我们 还 有 另 一 种 比较 对 象 类 型 的 方法 ， 那 就 是 将 检测 
得 到 的 类 型 与 一 个 已 知 类 型 进行 比较 。 如 果 这 样 ， 我 们 就 可 以 直接 使 用 type 对 象 而 不 用 每 次 计 
算出 这 个 对 象 来 。 那么 我 们 现在 修改 一 下 代码 2 改 为 只 八 调 用 一 次 type() 函 数 o 


>>> import types 


>>> if type(num) == types.IntType... 


(3) 对 象 值 比较 VS 对 象 身 份 比 较 


在 这 一 章 的 前 面部 分 我 们 讨论 了 对 象 的 值 比较 和 身份 比较 ， 如 果 你 了 解 其 中 的 关键 点 ， 你 就 
会 发 现 我 们 的 代码 在 性 能 上 还 不 是 最 优 的 。 在 运行 时 期 ， 只 有 一 个 类 型 对 象 来 表示 整 型 类 
型 。 也 就 是 说 ，type (0) ,type (42) ‚type (-100) 都 是 同一 个 对 象 <type ‘int'> 
(types.IntType 也 是 这 个 对 象 ) 。 

如 果 它 们 是 同一 个 对 象 ， 我 们 为 什么 还 要 浪费 时 间 去 获得 并 比较 它们 的 值 呢 〈 我 们 已 经 知道 
它们 是 相同 的 了 ) ? 所 以 比较 对 象 本 身 是 一 个 更 好 地 方案 。 下 面 是 改进 后 的 代码 。 


if type (num) is types.IntType... # or type(0) 
这 样 做 有 意义 吗 ? 我 们 用 对 象 身 份 的 比较 来 替代 对 象 值 的 比较 。 如 果 对 象 是 不 同 的 ， 那 意味 
着 原来 的 变量 一 定 是 不 同类 型 的 〈 因 为 每 一 个 类 型 只 有 一 个 类 型 对 象 ) ， 我 们 就 没有 必要 去 


检查 ( 值 ) 了 。 一 次 这 样 的 调用 可 能 无 关 紧 要 ， 不 过 当 很 多 类 似 的 代码 遍布 在 你 的 应 用 程序 
中 的 时 候 ， 就 有 影响 了 。 


(4) 减少 查询 次 数 


这 是 一 个 对 前 一 个 例子 较 小 的 改进 ， 如 果 你 的 程序 像 我 们 的 例子 中 做 很 多 次 比较 的 话 ， 程 序 
的 性 能 就 会 有 一 些 差异 。 为 了 得 到 整 型 的 对 象 类 型 ， 解 释 器 不 得 不 首先 查找 types 这 个 模块 的 
名 字 ， 然 后 在 该 模块 的 字典 中 查找 IntType。 通 过 使 用 from-import, 你 可 以 减少 一 次 查询 。 


from types import IntType 
if type(num) is IntType... 


(5) 惯例 和 代码 风格 


Pythori2.2 对 类 型 和 类 的 统一 导致 jsinstance() 内 建 函 数 的 使 用 率 大 大 增加 。 我 们 将 在 第 13 章 
(面向 对 象 编 程 ) 正式 介绍 isinstance(), 在 这 里 我 们 简单 浏览 一 下 。 
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这 个 布尔 函数 接受 一 个 或 多 个 对 象 作为 其 参数 ， 由 于 类 型 和 类 现在 都 是 一 回 事 ，int 现 在 既是 
一 个 类 型 又 是 一 个 类 。 我 们 可 以 使 用 isinstance() 函 数 来 让 我 们 的 放 语 多 更 方便 ， 并 具有 更 好 的 
可 读 性 。 


工业 isSinstanceí(num, int)... 


在 判断 对 象 类 型 时 也 使 用 isinstance() 已 经 被 广 为 接 受 ， 我 们 上 面 的 typechk.py 脚 本 最 终 与 改 成 
了 使 用 isinstance() 函 数 。 值 得 一 提 的 是 ，isinstance() 接 受 一 个 类 型 对 象 的 元 组 作为 参数 ， 这 
样 我 们 就 不 必 像 使 用 type() 时 那样 写 一 堆 if-elif-else 判 断 了 。 


4.6.5 Python 类 型 操作 符 和 内 建 函 数 总 结 


表 4.5 列 出 了 所 有 操作 符 和 内 建 函 数 ， 其 中 操作 符 顺 序 是 按 优先 级 从 高 到 低 排 列 的 。 同 一 种 灰 
度 的 操作 符 拥 有 同样 的 优先 级 。 注 意 在 operator 模 块 中 有 这 些 (和 绝 大 多 数 Python ) 操作 符 相 
应 的 同 功能 的 函数 可 供 使 用 。 


胡 4.5 标准 类 型 操作 符 和 内 建 函 数 


Y qos 














a 布尔 比较 总 是 返回 True 或 False 


4.7 类 型 工厂 函数 
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Pythori2.2 统 一 了 类 型 和 类 ， 所 有 的 内 建 类 型 现在 也 都 是 类 ， 在 这 基础 之 上 ， 原 来 的 所 谓 内 建 
转换 函数 像 int()、type() 、list() 等 ， 现 在 都 成 了 工厂 函数 。 也 就 是 说 虽然 他 们 看 上 去 有 点 像 函 
数 ， 实 质 上 他 们 是 类 。 当 你 调用 它们 时 ， 实 际 上 是 生成 了 该 类 型 的 一 个 实例 ， 就 像 工 厂 生产 
货物 一 样 。 


下 面 这 些 大 家 熟悉 的 工厂 函数 在 之 前 的 Python 版 里 被 称 为 内 建 函 数 。 
e int (), long (), float (), complex () 
e str(), unicode (), basestring () 
e list (), tuple() 
e type() 


以 前 没有 工厂 防 数 的 其 他 类 型 ， 现 在 也 都 有 了 工厂 函数 。 除 此 之 外 ， 那 些 支 持 新 式 类 的 全 新 
的 数据 类 型 ， 也 添加 了 相应 的 工厂 函数 。 下 面 列 出 了 这 些 工厂 函数 。 


e dict () 

e bool () 

e set (), frozenset () 
e object () 

e classmethod () 

e staticmethod () 

e super () 

e property () 


e file () 


4.8 ”标准 类 型 的 分 类 


如 果 让 我 们 最 嘿 哑 地 描述 标准 类 型 ， 我 们 也 许 会 称 它们 是 Python 的 “基本 内 建 数据 对 象 原始 类 


JU" o 


o “基本 ”是 指 这 些 类 型 都 是 Python 提 供 的 标准 或 核心 类 型 。 


Pe 


e 
A 


建 ? 是 由 于 这 些 类 型 是 Python 默认 就 提供 的 。 

o “数据 "是 因为 他 们 用 于 一 般 数据 存储 。 

e “对象 "是 因为 对 象 是 数据 和 功能 的 默认 抽象 。 

o “原始 "是 因为 这 些 类 型 提供 的 是 最 底层 的 粒度 数据 存储 。 
o “类 型 "是 因为 他 们 就 是 数据 类 型 。 


不 过 ， 上 面 这 些 描述 实际 上 并 没有 告诉 你 每 个 类 型 如 何 工 作 ， 以 及 它们 能 发 挥 什么 作用 。 事 
实 上 ， 几 个 类 型 共享 某 一 些 的 特性 ， 比 如 功能 的 实现 手段 ， 另 一 些 类 型 则 在 访问 数据 值 方面 
有 一 些 共同 之 处 。 我 们 感 、 兴 趣 的 还 有 这 些 类 型 的 数据 如 何 更 新 ， 以 及 它们 能 提供 什么 样 的 
存储 。 有 3 种 不 同 的 模型 可 以 帮助 我 们 对 基本 类 型 进行 分 类 ， 每 种 模型 都 展示 给 我 们 这 些 类 型 

之 间 的 相互 关系 。 这 些 模型 可 以 帮助 我 们 更 好 的 理解 类 型 之 间 的 相互 关系 以 及 他 们 的 工作 原 
理 。 


4.8.1 存储 模型 


我 们 对 类 型 进行 分 类 的 第 一 种 方式 ， 就 是 看 着 这 种 类 型 的 对 象 能 保存 多 少 个 对 象 。Python 的 
类 型 ， 就 像 绝 大 多 数 其 他 语言 一 样 ， 能 容纳 一 个 或 多 个 值 。 一 个 能 保存 单个 字面 对 象 的 类 
型 ， 我 们 称 它 为 原子 或 标量 存储 ; ne 
对 象 有 时 会 在 文档 中 被 称 为 复合 对 象 ， 不 过 这 些 对 象 并 不 仅仅 指 类 型 ， 还 包括 类 似 类 实例 这 
样 的 对 象 ) 。 容 器 类 型 又 带 来 一 个 新 问题 ， 那 就 是 它 是 否 可 以 容纳 不 同类 型 的 对 象 。 所 有 的 
Python 容器 对 象 都 能 够 容纳 不 同类 型 的 对 象 。 表 4.6 按 存储 模型 对 Python 的 类 型 进行 了 分 类 。 


字符 串 看 上 去 像 一 个 容器 类 型 ， 因 为 它 “ 包 含 "字符 (并 且 经 常 多 于 一 个 字符 ) ， 不 过 由 于 
Python 并 没有 字符 类 型 (参见 章节 4.8) ,所 以 字符 串 是 一 个 自我 包含 的 文字 类 型 。 











X46 以 存储 模型 为 标准 的 类 型 分 类 
存储 模型 
分 类 | Python 类 型 
标量 /原子 类 型 iut 《所 有 的 数值 类 型 ) ， 字 符 串 《〔 全 部 是 文字 》 








容器 类 型 列表 、 元 组、 TA 





4.8.2 更 新 模型 


另 一 种 对 标准 类 型 进行 分 类 的 方式 就 是 ， 针 对 每 一 个 类 型 问 一 个 问题 :“ 对 象 创建 成 功 之 后 ， 
它 的 值 可 以 进行 更 新 吗 ? "在 前 面 我 们 介绍 Python 数据 类 型 时 曾经 提 到 ， 茶 些 类 型 允许 他 们 的 
值 进行 更 新 ， 而 另 一 些 则 不 允许 。 可 变 对 象 允许 他 们 的 值 被 更 新 ， 而 不 可 变 对 象 则 不 允许 他 
们 的 值 被 更 改 。 表 4.7 列 出 了 支持 更 新 和 不 支持 更 新 的 类 型 。 


看 完 这 个 表 之 后 ， 你 可 能 马上 冒 出 一 个 问题 : “等 等 ， 你 说 数值 和 字符 串 对 象 是 不 可 改变 的 ?看 
看 下 面 的 例子 1 ” 


x = "Python numbers and strings' 

x = 'are immutable?!? What gives?' 
i20 

和 A a 


“在 我 看 来 ， 这 可 不 像 是 不 可 变 对 象 的 行为 1 " 没 错 ， 是 这 XE 不 过 你 还 没有 搞 清 楚 幕 后 的 昌 
相 。 上 面 的 例子 中 ， 事 实 上 是 一 个 新 对 象 被 创建 ， 然 后 它 取代 了 旧 对 象 。 就 是 这 样 ， 请 多 读 
一 人 遍 这 段 。 


人 量 名 ， 旧 对 象 被 丢弃 ， 垃 圾 回收 器 会 在 适当 的 时 机 回收 这 些 
对 象 。 你 可 以 通过 内 建 函 数 id() 来 确认 对 象 的 身份 在 两 次 赋值 前 后 发 生 了 变化 。 


R47 以 更 新 模型 为 标准 的 类 型 分 类 
更 新 模型 










Python 类 型 
P». FA 
数字 、 字 符 串 、 元 组 





可 变 类 型 
不 可 变 类 型 











下 面 我 们 在 上 面 的 例子 里 加 上 id() 调 用 ， 就 会 清楚 地 看 到 对 象 实际 上 已 经 被 替换 了 。 


一 
一 

oO 

= 


>>> X = "Python numbers and strings' 
>>> print id(x) 

16191392 

>>> x = 'are immutable?!? What gives?' 
>>> print id(x) 

16191232 

225» i172 0 

>>> print id(i) 

7749552 

>>> i= i +1 

2»» print id(i) 

71149600 


你 看 到 的 身份 数字 很 可 能 和 我 不 同 ， 每 次 执行 这 些 数字 也 会 不 同 ， 这 是 正常 的 。 这 个 数字 与 
该 对 象 当 时 分 配 的 内 存 地 址 密切 相关 。 因 此 不 同 的 机 器 、 不 同 的 执行 时 间 都 会 生成 不 同 的 对 
象 身份 。 另 一 类 对 象 ， 列 表 可 以 被 修改 而 无 须 替 换 原 始 对 象 ， 请 看 下 面 的 例子 。 
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>>> aList = ['ammonia', 83, 85, 'lady'] 
>>> aList 

['ammonia', 83, 85, 'lady'] 

>>> 

>>> aList[2] 

85 

>>> 

>>> id(aList) 

135443480 

>>> 


>>> aList[2] = aList[2] + 1 


'stereo' 


>>> aList[3] 
>>> aList 
['ammonia', 83, 86, 'stereo'] 

>>> 

>>> id(aList) 

135443480 

>>> 

>>> aList.append('gaudy') 

>>> aList.append(aList[2] + 1) 

>>> aList 

['ammonia', 83, 86, 'stereo', 'gaudy', 87] 
>>> 

>>> id(aList) 

135443480 


意 列表 的 值 不 论 怎么 改变 ， 列 表 的 ID 始终 保持 不 变 。 


4.8.3 访问 模型 


管 前 面 两 种 模型 分 类 方式 在 介绍 Python 时 都 很 有 用 ， 它 们 还 不 是 区 分 数据 类 型 的 首要 模 
型 。 对 这 种 目的 ， 我 们 使 用 访问 模型 。 也 就 是 说 根据 访问 我 们 存储 的 数据 的 方式 对 数据 类 型 
进行 分 类 。 在 访问 模型 中 共有 三 种 访问 方式 : 直接 存 取 、 顺 序 和 映射 。 表 4.8 按 访问 方式 对 数 
据 类 型 进行 了 分 类 。 


对 非 容 器 类 型 可 以 直接 访问 。 所 有 的 数值 类 型 都 归 到 这 一 类 。 
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序列 类 型 是 指 容器 内 的 元 素 按 从 0 开始 的 索引 顺序 访问 。 一 次 可 以 访问 一 个 元 素 或 多 个 元 素 ， 
也 就 是 大 家 所 了 解 的 切片 (slice) 。 字 符 串 、 列 表 和 元 组 都 归 到 这 一 类 。 我 们 前 面 提 到 过 ， 

Python 不 支持 字符 类 型 ， 因 此 ， 虽 然 字符 串 是 简单 文字 类 型 ， 但 因为 它 有 能 力 按照 顺序 访问 
子 字符 串 ， 所 以 也 将 它 归 到 序列 类 型 。 


映射 类 型 类 似 序列 的 索引 属性 ， 不 过 它 的 索引 并 不 使 用 顺序 的 数字 偏 移 量 取 值 ， 它 的 元 素 无 
序 存放 ， 通 过 一 个 唯一 的 键 来 访问 ， 这 就 是 映射 类 型 ， 它 容纳 的 是 哈 希 键 - 值 对 的 集合 。 


我 们 在 以 后 的 章节 中 将 主要 使 用 访问 模型 ， 详 细 介绍 各 种 访问 模型 的 类 型 ， 以 及 某 个 分 类 的 
类 型 之 间 有 哪些 相同 之 处 ( 比如 操作 符 和 内 建 函 数 ) ， 然 后 讨论 每 种 Python 标准 类 型 。 所 有 
类 型 的 特殊 操作 符 、 内 建 函 数 及 方法 都 会 在 相应 的 章节 特别 说 明 。 


为 什么 要 对 同样 的 数据 类 型 再 三 分 类 呢 ? 首先 ， 我 们 为 什么 要 分 类 ? 因为 Python 提供 了 高 级 
的 数据 结构 ， 我 们 需要 将 那些 原始 的 类 型 和 功能 强大 的 扩展 类 型 区 分 开 来 。 另 一 个 原因 就 是 
这 有 助 于 搞 清楚 某 种 类 型 应 该 具有 什么 行为 。 举 例 来 说 ， 如 果 我 们 基本 上 不 用 问 自己 “列表 和 
元 组 有 什么 区 别 ? "或 "什么 是 可 变 类 型 和 不 可 变 类 型 ? "这 些 问 题 的 时 候 ， 我 们 也 就 达到 了 目 

的 。 最 后 ， 某 些 分 类 中 的 所 有 类 型 具有 一 些 相同 的 特性 。 一 个 优秀 的 工匠 应 该 知道 他 或 她 的 

工具 箱 里 都 有 哪些 宝贝 




















X 4.8 以 访问 模型 为 标准 的 类 型 分 类 
访问 模型 
分 类 Python 类 型 
直接 访问 数字 ! 
mr fa 学 符 串 、 列 表 、 元 组 








映射 访问 Y 



































X49 标准 类 型 分 类 
数据 类 型 存储 模型 更 新 模 弄 HAT 
"m, | 标量 不 可 更 改 直接 访问 
EE E | Ld | 不 可 更 改 NUT i fa 
列表 | P | 可 更 改 viru iol 
元 组 m "X 不 可 更 改 ”顺序 访问 
7RA Am T 映射 访问 





另 一 个 问题 就 是 ，“ 为 什么 要 用 这 么 多 不 同 的 模型 或 从 不 同 的 方面 来 分 类 ? ”所 有 这 些 数据 类 型 
看 上 去 是 很 难 分 类 的 。 它 们 彼此 都 有 着 错综复杂 的 关系 ， 所 有 类 型 的 共同 之 处 最 好 能 揭示 出 
来 ， 而 且 我 们 还 想 揭示 每 种 类 型 的 独到 之 处 。 没 有 两 种 类 型 模 跨 所 有 的 分 类 (当然 ， 所 有 的 
数值 子 类 型 做 到 了 这 一 点 ， 所 以 我 们 将 它们 归纳 到 一 类 当中 ) 。 最 后 ， 我 们 确信 搞 清 所 有 类 
型 之 间 的 关系 会 对 你 的 开发 工作 有 极 大 的 帮助 。 你 对 每 种 类 型 的 了 解 越 多 ， 你 就 越 能 在 自己 
的 程序 中 使 用 恰当 的 类 型 以 达到 最 佳 的 性 能 。 


我 们 提供 了 一 个 汇总 表 CRAS) 。 表 中 列 出 了 所 有 的 标准 类 型 和 我 们 使 用 的 三 个 模型 ， 以 及 
每 种 类 型 归 入 的 分 类 。 


49 不 支持 的 类 型 


在 我 们 深入 了 解 各 个 标准 类 型 之 前 ， 我 们 在 本 章 的 结束 列 出 Python 目 前 还 不 支持 的 数据 类 型 
(因为 在 不 同 的 语言 中 其 相应 的 命名 可 能 有 这 异 ， 所 以 为 了 不 扰乱 读者 ， 在 各 节 开 头 保持 了 
类 型 原文 一 一 译 者 注 ) 。 





1. char 或 byte 


Python 没 有 char 或 Dyte 类 型 来 保存 单一 字符 或 8 位 整 型 。 你 可 以 使 用 长 度 为 1 的 字符 串 表 示 字 
符 或 8 位 整 型 。 


2. 指 针 


Python 替 你 管理 内 存 ， 因 此 没有 必要 访问 指针 。 在 Python 中 你 可 以 使 用 id() 函 数 得 到 一 个 对 象 
的 身份 号 ， 这 是 最 接近 于 指针 的 地 址 。 因 为 你 不 能 控制 这 个 值 ， 所 以 其 实 没 有 太 大 意义 。 其 
实在 Python 中 ， 一 切 都 是 指针 。 


3. int vs short vs long 


Python 的 普通 整 型 相当 于 标准 整 型 类 型 ， 不 需要 类 似 C 语 言 中 的 int、short 和 long 这 三 种 整 型 
类 型 。 事 实 上 Python 的 整 型 实现 等 同 于 C 语 言 的 长 整 型 。 由 于 Python 的 整 型 与 长 整 型 密切 融 
合 ， 用 户 几 乎 不 需要 担心 什么 。 你 仅 需 要 使 用 一 种 类 型 ， 就 是 Python 的 整 型 。 即 便 数 值 超出 
整 型 的 表达 范围 ， 比 如 两 个 很 大 的 数 相 乘 ，Python 会 自动 的 返回 一 个 长 整 型 给 你 而 不 会 报 


错 。 
4. float vs double 


C 语 言 有 单 精 度 和 双 精 度 两 种 浮 点 类 型 。Python 的 浮 点 类 型 实际 上 是 C 语 言 的 双 精 度 浮 点 类 
型 。Python 认 为 同时 支持 两 种 浮 点 类 型 的 好 处 与 支持 两 种 浮 点 类 型 带 来 的 开销 不 成 比例 ， 所 
以 Python 决定 不 支持 单 精度 浮 点 型 。 对 那些 宁愿 放弃 更 大 的 取 值 范围 而 需要 更 高 精确 度 的 用 
户 来 说 ，Python 还 有 一 种 十 进 制 浮 点 型 类 型 Decimal, 不 过 你 必须 导入 decimal 模 块 才 可 以 使 用 
它 。 浮 点 型 总 是 不 精确 的 。Decimals 则 拥有 任意 的 精度 。 在 处 理 金钱 这 类 确定 的 值 时 ， 
Decimal 类 型 就 很 有 用 。 在 处 理 重量 、 长 度 或 其 他 度量 单位 的 场合 ，float 足 够 用 了 。 


4.10 练习 


Python 核心 编程 第 二 版 


4-1.Python 对 象 。 与 所 有 Python 对 象 有 关 的 三 个 属性 是 什么 ? 请 简单 的 描述 一 下 。 


4-2. 类 型 。 不 可 更 改 (immutable) 指 的 是 什么 ?_ Python 的 哪些 类 型 是 可 更 改 的 
(mutable) ,哪些 不 是 ? 


4-3. 类 型 。 哪 些 Python 类 型 是 按照 顺序 访问 的 ， 它 们 和 映射 类 型 的 不 同 是 什么 ? 
4-4.type()。 内 建 函 数 type() 做 什么 ? type() 返 回 的 对 象 是 什么 ? 


4-5.str() 和 repr()。 内 建 函 数 str() 与 repr() 之 间 的 不 同 是 什么 ? 哪 一 个 等 价 于 反 引 号 CU) 
操作 符 ? 


4-6. 对 象 相等 。 你 认为 type (a) =type (b) type (a) istype (b) 之 间 的 不 同 是 什 


么 ?为 什么 会 选择 后 者 ? 函数 isinstance() 与 这 有 什么 关系 ? 


4-7. 内 建 函 数 dir()。 在 第 2 章 的 几 个 练习 中 ， 我 们 用 内 建 函 数 dir() 做 了 几 个 实验 ， 它 接受 


一 个 对 象 ， 然 后 给 出 相应 的 属性 。 请 对 types 模 块 做 相同 的 实验 。 记 下 你 熟悉 的 类 型 ， 


包 
括 你 对 这 些 类 型 的 认识 ， 然 后 记 下 你 还 不 熟悉 的 类 型 。 在 学 习 Python 的 过 程 中 ， 你 要 逐 


步 将 "不 熟悉 “的 类 型 变 得 "熟悉 "起 来 。 
4-8. 列 表 和 元 组 。 列 表 和 元 组 的 相同 点 是 什么 ? 不 同 点 是 什么 ? 


4-9.* 实 践 ， 给 定 以 下 赋值 : 


a-10 
b = 10 
c - 100 
d = 100 
e - 10.0 
f - 10.0 


请 问 下 面 各 表达 式 的 输出 是 什么 ?为 什么 ? 
(a) aisb 
(b) cisd 


(c) eisf 
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+ 复数 

e 操作 符 

e 内 建 函数 

e 其 他 数字 类 型 
e. 相关 模块 


本 章 的 主题 是 Python 中 的 数字 。 我 们 会 详细 介绍 每 一 种 数字 类 型 ， 它 们 适用 的 各 种 操作 符 ， 
4、 以 及 用 于 处 理 数字 的 内 建 函 数 。 在 本 章 的 末尾 ， 我 们 简单 介绍 了 几 个 标准 库 中 用 于 处 理 数 
字 的 模块 。 


5.1 数字 简介 


不 可 更 改 类 型 ， 也 就 是 说 变更 数字 的 值 会 生成 新 的 对 
对 用 户 都 是 透明 的 ， 并 不 会 影响 软件 的 开发 方式 。 


fi Dm 


Python 支持 多 种 数字 类 型 : 整 型 、 长 整 型 、 布 尔 型 、 双 精度 浮 点 型 、 十 进 制 浮 点 型 和 复数 。 


5.1.1 如 何 创建 数值 对 象 并 用 其 赋值 (数字 对 象 ) 
创建 数值 对 象 和 给 变量 赋值 一 样 同样 简单 。 

anint = 1 

aLong = -9999999999999999L 


aComplex = 1.23*4.56J 


5.1.2 ”如 何 更 新 数字 对 象 


通过 给 数字 对 象 (重新 ) 赋值 ， 您 可 以 “更 新 "一 个 数值 对 象 。 我 们 之 所 以 给 更 新 这 两 个 字 加 上 
引号 ， 是 因为 实际 上 并 没有 更 新 该 对 象 的 原始 数值 。 这 是 因为 数值 对 象 是 不 可 改变 对 象 。 
Python 的 对 象 模型 与 常规 对 象 模型 有 些 不 同 。 你 所 认为 的 更 新 实际 上 是 生成 了 一 个 新 的 数值 
对 象 ， 并 得 到 它 的 引用 。 

在 学 习 编程 的 过 程 中 ， 我 们 一 直接 受 这 样 的 教育 : 变量 就 像 一 个 金子 ， 里 面 装着 变量 的 值 。 
在 Python 中 ， 变 量 更 像 一 个 指针 指向 装 变量 值 的 盒子 。 对 不 可 改变 类 型 来 说 ， 你 无 法 改变 盒 
子 的 内 容 ， 但 可 以 将 指针 指向 一 个 新 金子 。 每 次 将 另外 的 数字 赋 给 变量 的 时 候 ， 实 际 上 是 创 
建 了 一 个 新 的 对 象 并 把 它 赋 给 变量 (不 仅仅 是 数字 ， 对 于 所 有 的 不 可 变 类 型 ， 都 是 如 此 ) o 


anint +=1 


aFloat = 2.718281828 


5.1.3 如何 删除 数字 对 象 


按照 Python 的 法 则 ， 你 无 法 熙 正 删 除 一 个 数值 对 象 ， 你 仅仅 是 不 再 使 用 它 而 已 。 如 果 你 确实 
想 删 除 一 个 数值 难 的 引用 ， 使 用 del 语 句 即 可 (参见 3.5.6 小 节 ) 。 删 除 对 象 的 引用 之 后 ， 你 就 
不 能 再 使 用 这 个 引用 (变量 名 ) ， 除 非 你 给 它 赋 一 个 新 值 。 如 果 试 图 使 用 一 个 已 经 被 删除 的 
对 象 引用 ， 会 引发 NameError 蜡 常 。 


del anint 
del aLong, aFloat, aComplex 


好 了 ， 了 既然 你 已 经 了 解 如 何 创 建 和 更 新 数值 对 象 ， 那 么 来 看 一 下 Python 的 4 种 主要 数字 类 型 。 


5.2 ” 整 弄 


Python 有 几 种 整 型 类 型 。 布 尔 类 型 是 只 有 两 个 值 的 整 型 。 常 规整 型 是 绝 大 多 数 现 代 系 统 都 能 
识别 的 整 型 。Python 也 有 长 整 型 类 型 。 然 而 ， 它 表示 的 数值 大 小 远 超过 C 语 言 的 长 整 型 。 下 面 
我 们 先 来 了 解 一 下 这 些 类 型 ， 然 后 再 来 研究 那些 用 于 Python 整 型 类 型 的 操作 符 和 内 建 函 数 。 


5.2.1 布尔 型 


Python 从 版 本 2.3 开 始 支 持 布尔 类 型 。 该 类 型 的 取 值 范围 只 有 两 个 值 ， 也 就 是 布尔 值 True 和 布 
尔 值 False。 我 们 会 在 本 章 的 末尾 一 节 5.7.1 详 细 讲 解 布 尔 对 象 。 


5.2.2 标准 整 型 


Python 的 标准 整 型 类 型 是 最 通用 的 数字 类 型 。 在 大 多 数 32 位 机 器 上 ,标准 整 型 类 型 的 取 值 范围 
是 -2**31 到 2*31-1, 也 就 是 -2 147 483 648—2 147 483 647。 如 果 在 64 位 机 器 上 使 用 64 位 编译 
器 编译 Python, 那 么 在 这 个 系统 上 的 整 型 将 是 64 位 。 下 面 是 一 些 Python 标 准 整 型 类 型 对 象 的 例 


o 


«qi 


0101 84. -237 0x80 017 -680 -0X92 


Python 标准 整 型 类 型 等 价 于 C 的 〈 有 符号 ) 长 整 型 。 整 型 一 般 以 十 进 制 表示 ， 但 是 Python 也 
支持 八进制 或 十 六 进 制 来 表示 整 型 。 如 果 八 进 制 整 型 以 数字 “0" 开 始 ， 十 六 进 制 整 型 则 
以 “0x” 或 “0X” 开 始 5 


5.23 KE 


关于 Python 长 整 型 类 型 我 们 必须 要 提 的 是 ， 请 不 要 将 它 和 C 或 其 他 编译 型 语言 
淆 。 那 些 语言 的 长 整 型 典型 的 取 值 范围 是 32 位 或 64 位 。Python 的 长 整 型 类 型 能 表达 的 数值 仅 
仅 与 你 的 机 器 支持 的 ( 诀 拟 ) 内 存 大 小 有 关 ， 换 句 话说，Python 能 轻松 表达 很 大 的 整 型 。 


型 类 型 是 标准 整 型 类 型 的 超 集 ， 当 你 的 程序 需要 使 用 比 标准 整 型 类 型 更 大 的 整 型 时 ， 长 
整 型 类 型 就 有 用 武之 地 了 。 在 一 个 整 型 值 后 面 加 个 L (大 写 或 小 写 都 可 以 ) ， 表 示 这 个 整 型 是 
型 。 这 个 整 型 可 以 是 十 进 制 、 八 进 制 、 或 十 六 进 制 。 下 面 是 一 些 长 整 型 的 例子 。 


16384L -0x4E8L 017L-21474836481 052144364L 
2997924581 OxDECADEDEADBEEFBADFEEDDEAL -5432101234L 





核心 风格 : 用 大 写字 母 "L" 表 示 长 整 型 


尽管 Python 也 支持 用 小 写字 母 L 标 记 的 长 整形 ， 但 是 我 们 郑重 推荐 您 仅 使 用 大 写 的 "|L”， 这 样 能 
有 效 避 免 数字 1 和 小 写 L 的 混淆 。Python 在 显示 长 整 型 类 型 数值 的 时 候 总 是 用 大 写 “L”， 目 前 整 
型 和 长 整 型 正在 逐渐 绥 慢 的 统一 ， 您 只 有 在 对 长 整 型 调用 repr() 函 数 时 才 有 机 会 看 到 “L”， 如 果 
对 长 整 型 对 象 调 用 str() 函 数 就 看 不 到 L。 举 例如 下 。 


Python 核心 编程 第 二 版 


>>> aLong = 9999999991] 
>>> aLong 

9999999991 

>>> print aLong 
999999999 


5.2.4 整 型 和 长 整 型 的 统一 


这 两 种 整 型 类 型 正在 逐渐 统一 为 一 种 。 在 Python 2.2 以 前 ， 标 准 整 型 类 型 对 象 超出 取 值 范围 会 
溢出 (比如 上 面 提 到 的 大 于 2*32 的 数 ) ， 但 是 从 Pythcm2.2 以 后 就 再 也 没有 这 样 的 错误 了 。 


Python 2.1 


>>> 9999 ** 8 
Traceback (most recent call last): 
File "éstdin»", ine 1, in ? 


OverflowError: integer exponentiation 


Python 2.2 


>>> USUS ** 8 
99920027994400699944002799920001L 


移 除 这 个 错误 是 第 一 步 。 下 一 步 修改 位 移 位 ， 左 移 位 导致 出 界 (导致 0 值 ) 在 过 去 是 经 常 可 能 
发 生 的 事 。 


255 2 cec 32 
0 


在 Python2.3 中 ， 这 个 操作 产生 一 个 警告 ， 不 过 在 2.4 版 里 移 除 了 这 个 Warning， 并 且 这 步 操作 
生成 了 一 个 昌 正 的 长 整 型 。 


Python 2.3 


oo» 2 «e 327 
8589934592L 


不 远 的 将 来 ， 至 少 普通 用 户 会 几乎 感觉 不 到 长 整 型 的 存在 。 必 要 时 整 型 会 悄悄 自动 转换 为 长 
整 型 。 当 然 ， 那 些 要 调用 C 的 人 仍然 可 以 继续 使 用 这 两 种 整 型 类 型 ， 因 为 C 代 码 必 须 区 分 不 同 
9 整 型 类 型 。 如 果 你 想 详细 了 解 标准 整 型 与 长 整 型 整合 的 信息 ， 请 阅读 PEP237。 


In. 


5.3 双 精 度 浮 点 型 


Python 中 的 浮 点 型 类 似 C 语 言 中 的 double 类 型 ， 是 双 精 度 浮 点 型 ， 可 以 用 直接 的 十 进 制 或 科学 
计数 法 表示 。 每 个 浮 点 型 占 8 个 字 节 (64 位 )， 完 全 遵守 IEEE754 号 规范 (52M/11E/1S ) ,其 
中 52 个 位 用 于 表示 底 ，11 个 位 用 于 表示 指数 (可 表示 的 范围 大 约 是 +10**308.25) ， 剩 下 的 一 
个 位 表示 符号 。 这 看 上 去 相当 完美 ， 然 而 ， 实 际 精度 依赖 于 机 器 架构 和 创建 Python 解释 器 的 
编译 器 。 

浮 点 型 值 通常 都 有 一 个 小 数 点 和 一 个 可 选 的 后 级 @ (大 写 或 小 写 ， 表 示 科 学 计数 法 ) 。 在 e 和 
指数 之 间 可 以 用 正 (+) 或 负 (-) 表示 指数 的 正 负 ( 正 数 的 话 可 以 省 略 符号 ) 。 下 面 是 一 些 典 
型 的 浮 点 型 值 的 例子 。 


0.0 -777. 1.6 -5.555567119 96e3 * 1.0 
4.3e25 9.384e-23 -2.172818 float(12) 1.000000001 
3.1416  4.2E-10 -90. 6.022e23 -1.609E-19 


54 复数 


在 很 久 以 前 ， 数 学 家 们 被 下 面 这 样 的 等 式 困扰 。 


x? = 一 ] 


这 是 因为 任何 实数 (无 论 正 数 还 是 负数 ) 乘 以 自己 总 是 会 得 到 一 个 非 负数 。 一 个 数 怎么 可 以 
乘 以 自己 却 得 到 一 个 负数 ? 没有 这 样 的 实数 存在 。 就 这 样 ， 直 到 18 世 纪 ， 数 学 家 们 发 明了 一 
个 虚拟 的 数 i (或 者 是 j, 看 你 读 的 是 哪 本 教科 书 了 ) 。 


j=V-l 


基于 这 个 特殊 的 数 (或 者 称 之 为 概念 ) ， 数 学 从 此 有 了 一 个 新 的 分 支 。 现 在 虚数 已 经 广泛 应 
用 于 数值 和 科学 计算 应 用 程序 中 。 一 个 实数 和 一 个 虚数 的 组 合 构成 一 个 复数 。 一 个 复数 是 一 
对 有 序 浮 点 型 (X，y) ,表示 为 X+ 肖 ， 其 中 X 是 实数 部 分 ，y 是 座 数 部 分 。 


复数 渐渐 在 日 常 运 工 、 机 械 、 电 子 等 行业 获得 了 广泛 的 应 用 。 由 于 一 些 研究 人 员 不 断 重 复制 
造 用 于 复数 运算 的 工具 ， 在 很 久 以 前 的 Pythcm1.4 版 本 里 ， 复 数 终 于 成 为 一 个 真正 Python 数据 
类 型 。 


下 面 是 Python 语言 中 有 关 复 数 的 几 个 概念 。 
e 虚数 不 能 单独 存在 ， 它 们 总 是 和 一 个 值 为 0.0 的 实数 部 分 一 起 来 构成 一 个 复数 。 
o 复数 由 实数 部 分 和 虚数 部 分 构成 。 
e 表示 虚数 的 语法 : real+imagj。 
e 实数 部 分 和 虚数 部 分 都 是 浮 点 型 。 


。 雇 数 部 分 必须 有 后 缀 ] 或 J 。 


下 面 是 一 些 复 数 的 例子 : 

64.375+1j 4.23-8.5j 0.23-8.55j  1.23e-04546.7e4089j 
6.23«1.5j -1.23-875J 0+1j  9.80665-8.31441J -.0224+0j 
复数 的 内 建 属 性 


复数 对 象 拥有 数据 属性 (参见 4.1.1 节 ) ， 分 别 为 该 复数 的 实 部 和 虚 部 。 复 数 还 拥有 conjugate 
方法 ， 调 用 它 可 以 返回 该 复数 的 共 示 复 数 对 象 ( 两 头 牛 背 上 的 架子 称 为 二 ， 罗 使 两 头 牛 同步 
行走 。 共 力 即 为 按 一 定 的 规律 相配 的 一 对 译 者 注 ) e 





>>> aComplex = -8.333-1.47j 
>>> aComplex 

(-8.333-1.471) 

>>> aComplex.real 

28.333 

>>> aComplex.imag 

m S Fi 

>>> aComplex.conjugate() 
(-8.333+1.47)) 


表 5.1 描 述 了 复数 的 所 有 属性 


表 5.1 复数 属性 
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num. real 











num. imag 











num. conjugate <) 


5.5 操作 符 


数值 类 型 可 进行 多 种 运算 。 从 标准 操作 符 到 数值 操作 符 ， 甚 至 还 有 专门 的 整 型 操作 符 。 


5.5.1 混合 模式 操作 符 


也 许 你 还 记得 ， 过 去 将 两 个 数 相 加 时 ， 你 必须 努力 保证 操作 数 是 合适 的 类 型 。 自 然 地 ， 加 法 
总 是 使 用 + 号 ， 然 而 在 计 草 机 语言 看 来 这 件 事 没 那么 简单 ， 因 为 数字 又 有 很 多 不 同 的 类 型 。 


当 两 个 整 型 相 加 时 ，+ 号 表示 整 型 加 法 ， 当 两 个 浮 点 型 相 加 时 ，+ 表 示 浮 点 型 加 法 ， 依 此 类 
推 。 在 Python 中 ， 甚 至 非 数 字 类 型 也 可 以 使 用 + 操作 符 。 举 例 来 说 ， 字 符 串 A+ 字 符 串 B 并 不 表 
示 加 法 操作 ， 它 表示 的 是 把 这 两 个 字符 串 连 接 起 来 ， 生 成 一 个 新 的 字符 串 。 关 键 之 处 在 于 支 
持 + 操 作 符 的 每 种 数据 类 型 ， 必 须 告 诉 Python, + 操作 符 应 该 如 何 去 工 作 。 这 也 体现 了 重 载 概念 
的 具体 应 用 。 


虽然 我 们 不 能 让 一 个 数字 和 一 个 字符 串 相 加 ， 但 Python 确实 支持 不 同 的 数字 类 型 相 加 。 当 一 
个 整 型 和 一 个 浮 点 型 相 加 时 ， 系 统 会 决定 使 用 整 型 加 法 还 是 浮 点 型 加 法 (实际 上 并 不 存在 混 
合 运 算 ) 。Python 使 用 数字 类 型 强制 转换 的 方法 来 解决 数字 类 型 不 一 致 的 问题 ， 也 就 是 说 它 
会 强制 将 一 个 操作 数 转 换 为 同 另 一 个 操作 数 相 同 的 数据 类 型 。 这 种 操作 不 是 随意 进行 的 ， 它 
遵循 以 下 基本 规则 。 


首先 ， 如 果 两 个 操作 数 都 是 同一 种 数据 类 型 ， 没 有 必要 进行 类 型 转换 。 仅 当 两 个 操作 数 类 型 
不 一 致 时 ，Python 才 会 去 检查 一 个 操作 数 是 否 可 以 转换 为 另 一 类 型 的 操作 数 。 如 果 可 以 ， 转 
换 它 并 返回 转换 结果 。 由 于 某 些 转换 是 不 可 能 的 ， 比 如 将 一 个 复数 转换 为 非 复数 类 型 ， 将 一 
个 浮 点 型 转换 为 整 型 等 ， 因 此 转换 过 程 必 须 遵 守 几 个 规则 。 


要 将 一 个 整 型 转换 为 浮 点 型 ， 只 要 在 整 型 后 面 加 个 “.0“ 就 可 以 了 。 要 将 一 个 非 复数 转换 为 复 
数 ， 则 只 需要 要 加 上 一 个 “0j" 的 虚数 部 分 。 这 些 类 型 转换 的 基本 原则 是 : 整 型 转换 为 浮 点 型 ， 
非 复 数 转 换 为 复数 。 在 Python 语言 参考 中 这 样 描述 coerce() 方 法 : 


。 如 果 有 一 个 操作 数 是 复数 ， 另 一 个 操作 数 被 转换 为 复数 ; 
。 否则 ， 如 果 有 一 个 操作 数 是 浮 点 型 ， 另 一 个 操作 数 被 转换 为 浮 点 型 ; 

。 否则 ， 如 果 有 一 个 操作 数 是 长 整 型 ， 则 另 一 个 操作 数 被 转换 为 长 整 型 s 
。 否则 ， 两 者 必然 都 是 普通 整 型 ， 无 须 类 型 转换 。 (参见 下 文中 的 示意 图 ) 


图 5-1 的 流程 图 冰释 了 强制 转换 的 规则 。 数 字 类 型 之 间 的 转换 是 自动 进行 的 ， 程 序 员 无 须 自己 
编码 处 理 类 型 转换 。 不 过 在 确实 需要 明确 指定 对 某 种 数据 类 型 进 特殊 类 型 转换 的 场合 ， 
Python 提供 了 coerce() 内 建 函 数 来 帮助 你 实现 这 种 转换 。 ( 见 5.6.2 小 节 ) 

下 面 演示 一 下 Python 的 自动 数据 类 型 转换 。 为 了 让 一 个 整 型 和 一 个 浮 点 型 相 加 ， 必 须 使 二 者 
转换 为 同一 类 型 。 因 为 浮 点 型 是 超 集 ， 所 以 在 运算 开始 之 前 ， 整 型 必须 强制 转换 为 一 个 浮 点 
型 ,运算 结果 也 是 浮 点 型 。 


>>> L + 4.9 
ui 


o ^ 
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START with 


Yes 


Convert 


Convert 
non-complex non-long 


to long 





a MEE Der ~ er NEE = e Ree Ec LEE Rn D GE RIS. T 


| Perform the desired numeric computation and STOP j 


图 5-1 数值 类 型 转换 


5.5.2 标准 类 型 操作 符 


第 4 章 中 讲 到 的 标准 操作 符 都 可 以 用 于 数值 类 型 。 上 文中 提 到 的 混合 模式 运算 问题 ， 也 就 是 不 
同 数据 类 型 之 间 的 运算 ， 在 运算 之 前 ，Python 内 部 会 将 两 个 操作 数 转 换 为 同一 数据 类 型 。 


下 面 是 一 些 数字 标准 运算 的 例子 。 
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>>> -719 >= 833 
False 


>>> 5+4e >= 2-3e 


v 
V 
v 
ho 
^ 
On 
A 
wW 


# same as (2 <5) and (5< 9) 


>>> 77 > 66 == 66 # same as ( 77 > 66 ) and ( 66 == 66 ) 
True 

>>> 0. < -90.4 < 55.3e2 !- 3 < 181 

False 

> (= < 1) og (1 <. -1) 


True 


5.5.3 算术 操作 符 


Python 支 持 单 目 操 作 符 正 号 (+) feft (一 ) ; 双 目 操作 符 +、 一 、*、/、% 和 ** 分 别 表 示 
加 法 、 减 法 、 乘 法 、 除 法 、 取 余 和 紧 运 算 。 从 Python2.2 起 ， 还 增加 了 一 种 新 的 整除 操作 
符 //。 


1. 除 法 





拥有 C 背 景 的 程序 员 一 定 熟 悉 传 统 除 法 也 就 是 说 ， 对 整 型 操作 数 ， 会 执行 “地 板 除 ”(floor， 
取 比 商 小 的 最 大 整 型 。 例 如 5 除 以 2 等 于 2.5, 其 中 "2? 就 称 为 商 的 “地 板 ”， 即 “地 板 除 " 的 结果 。 本 
书 中 使 用 “地 板 除 ”的 说 法 是 为 了 沿用 原作 者 的 风格 ， 译 者 注 ) 。 对 浮 点 操作 数 会 执行 由 正 的 除 
法 。 然 而 ， 对 第 一 次 学 编程 的 人 或 者 那些 依赖 精确 计算 的 人 来 说 ， 可 能 就 需要 多 次 调整 代码 
才能 得 到 自己 想 要 的 结果 。 

在 未 来 的 Python 版 本 中 ，Python 开 发 小 组 已 经 决定 改变 /操作 符 的 行为 。/ 的 行为 将 变更 为 莫 正 
的 除法 ， 会 增加 一 种 新 的 运算 来 表示 地 板 除 。 下 面 我 们 总 结 一 下 Python 现在 的 除法 规则 ， 以 
及 未 来 的 除法 规则 。 

传统 除法 

如 果 是 整 型 除法 ， 传 统 除 法 会 合 去 小 数 部 分 ， 返 回 一 个 整 型 (地 板 除 ) 。 如 果 操 作 数 之 一 是 
浮 点 型 ， 则 执行 真正 的 除法 。 包 括 Python 语 言 在 内 的 很 多 语言 都 是 这 种 行为 。 请 看 下 面 的 例 
子 。 


> S A T # perform integer result (floor) 
0 
»»» 1.0 / 2.0 # returns actual quotient: 


iR E 89 MA 


Wi iE RLGRGt XR EDO SEU Hp o CUEdETEZUCEM IIR o dEZGKKSPython T > xf 
是 除法 运算 的 标准 行为 。 现 阶段 通过 执行 from_fiiture_import division 指 令 ， 也 可 以 做 到 这 一 
Rg 


N 


>>> from _ future__ import division 

>>> 

2555 A # returns real quotient 
0.5 

»so 1.0 yf 2.0 # returns real quotient 
0.5 


地 板 除 


从 Python 2.2 开 始 ， 一 个 新 的 操作 符 // 已 经 被 增加 进来 ， 以 执行 地 板 除 : // 除 法 不 管 操 作 数 为 何 
种 数值 类 型 ， 总 是 舍 去 小 数 部 分 ， 返 回 数字 序列 中 比 盖 正 的 商 小 的 最 接近 的 数字 。 


>>% L7 2 # floors result, returns integer 
0 

23595» 1.0 fy 2:0 # floors result, returns float 
0.0 

»»» -1 //2 # move left on number line 

-1 


关于 除法 运算 的 变更 ， 支 持 的 人 和 反对 的 人 几乎 一 样 多 。 有 些 人 认为 这 种 变化 是 错误 的 ， 有 
些 人 则 不 想 修 改 自己 的 现 有 代码 ， 而 剩 下 的 人 则 想 要 上 趴 正 的 除法 。 

之 所 以 会 有 这 种 变化 是 因为 Python 的 核心 开发 团队 认为 Python 的 除法 运算 从 一 开始 就 设计 失 
误 。 特 别 是 ， 随 着 Python 的 乏 渐 发 展 ， 它 已 经 成 为 那些 从 未 接触 过 地 板 除 的 人 们 的 首选 学 习 
语言 。Python 语 言 的 创始 人 在 他 的 “What'ss New in Python 2.2" 一 文中 讲 到 : 


def velocity(distance, totalTime): 

rate = distance / totalTime 
你 可 能 会 说 ， 只 要 有 一 个 参数 为 浮 点 型 这 个 函数 就 能 正常 工作 。 像 上 面 提 到 的 那样 ， 要 确保 
它 能 正常 工作 需要 强制 将 参数 转换 为 浮 点 类 型 ， 也 就 是 rate = 


float (distance) /float (totalTime) 。 将 来 除法 将 转变 为 真正 的 除法 ， 上 面 的 代码 可 以 无 需 更 
改正 常 工 作 。 需 要 地 板 除 的 地 方 只 需要 改变 为 两 个 连续 的 除 号 。 


是 的 ， 代 码 会 受到 一 些 影 响 ，Python 团 队 己 经 创作 了 一 系列 脚本 来 帮助 你 转换 日 代码 ， 以 确 
保 它 能 适应 新 的 除法 行为 。 而 且 对 那些 强烈 需要 某 种 除法 行为 的 人 来 说 ,Python 解释 器 提供 了 
Qdivision_style 启 动 参 数 。-Qriew 执 行 新 的 除法 行为 ，-Qold 则 执行 传统 除法 行为 (默认 为 
Qold) 。 你 也 可 以 帮 有 站 你 的 用 户 使 用 -Qwarn 或 -Qwamall 参 数 度 过 过 渡 时 期 。 


关于 这 次 变化 的 详细 信息 可 以 参考 PEP238。 如 果 你 对 这 场 论战 感 兴 趣 ， 也 可 以 翻阅 2001 年 的 
comp.lang.python 归 档 。 表 5.2 总 结 了 除法 操作 符 在 不 同 Python 版 本 中 的 行为 差异 。 











x 5.2 除法 操作 符 的 行为 差异 
-*un | 21x AERAR | 22 及 更 新 版 本 22 及 更 新 版 本 
| | (No import division) ( impor of division) 
| 传统 除 LL i AIER 
+ — — 
k 地 板 除 alid 





2.5 8 
整 型 取 余 相当 容易 理解 ， 取 余 就 略 复杂 


商 取 小 于 等 于 精确 值 的 最 大 整 型 的 乘积 之 差 。 即 : x- (math.floor (x/y) *y) 或 者 


X 
X—|—|xy 


bd 


对 于 复数 ， 取 余 的 定义 类 似 于 浮 点 型 ， 不 同 之 处 在 于 商 仅 取 其 实数 部 分 ， 即 X- 
(math.floor< (x/y) .real) *y) 。 


ioo) 


FAR 


3 i6 X EE e — UE Z A 84548 X A bizda: iE ARNE A eA A ISTE CU — 
元 操作 符 优 先 级 低 ， 比 其 右 侧 操作 数 的 一 元 操作 符 的 优先 级 高 ， 由 于 这 个 特性 你 会 在 算术 操 
作 符 表 中 找到 两 个 *。 下 面 举 几 个 例子 : 


Ek 


Python 核心 编程 第 二 版 


> > 3 w* 2 


9 


>>> -3 ** 2 4 ** 优先 级 高 于 左 侧 的 - 
-9 
>>> (-3) ** 


9 


# 加 括号 提高 -的 优先 级 


>>> 4.0 ** -1.0 4 ** 优先 级 低 于 右 侧 的 - 
0.25 


第 2 种 情况 下 解释 器 先 计算 3*2 再 取 其 相反 数 ， 我 们 需要 给 “-3”" 加 上 括号 来 得 到 我 们 希望 的 结 
果 。 最 后 一 个 例子 ， 结 果 是 4** (-1) ,这 是 按照 规定 的 优先 级 获得 的 结果 。 


注意 1/4 作 为 整 型 除法 结果 是 0 所 以 以 整 型 为 底 进行 负数 指数 运算 会 引发 一 个 negative power 
(负数 指数 ) 异常 。 


> 


Traceback (innermost last): 


Va 


> 84S ** 


File "€stdin»", line 1, in 7? 


lueError: integer to the negative power 


4. 总 结 


v fü 


表 5.3 


总 结 了 所 有 的 算术 操作 符 ， 从 上 到 下 ， 计 算 优 先 级 依次 降低 


比 即将 在 5.5.4 小 节 讲 到 的 位 操作 符 优 先 级 高 。 


* 


第 5 章 


5.3 
算术 换 作 符 

expr 1**expr 2 
*expr 

-expr 

expr I**expr 2 
expr I*expr 2 
expr l/expr 2 
expr I//expr 2 
expr I*5expr 2 
expr I*expr 2 
expr l-expr 2 


** WefETHULOCUR STE H MU IETS 


数字 


算术 操作 符 
功 能 

表达 式 1 表达 表达 式 2 结果 * 
i MES TE 
n UR TES MU 
表达 式 1 表达 表达 式 2 984 * 
表达 式 1 RUKA 2 
表达 式 1 除 以 表达 式 2《 传 统 除 或 真正 除 ) 
表达 式 1 地 板 除 以 表达 式 2 
表达 式 1 对 表达 式 2 取 余 
表达 式 1 加 表达 式 2 
表达 式 1 减 表达 式 2 


。 这 里 列 出 的 所 有 操作 符 都 
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下 面 是 更 多 Python 数值 运算 的 例子 : 


»»» -442 = T] 
-519 

>>> 

s»» 4 REE 3 

64 

>>> 

255 Q2 E* 3.2 
98.7183139527 
sso 8 / 3 

2 

»»» 8.0 / 3.0 
2.66666666667 
»»85$3 

2 

500 [BU. e 32.) * [1 5. 7.9. ) 
15.5555555556 
>>> 14 * 0x04 
56 

>>> 0170 / 4 

30 

>>> 0x80 + 0777 
639 

>>> 45L * 22L 
990L , 
>>> 16399L + OxA94E8L 
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709879L 


>>> -2147483648L - 52147483648L 


-54294967296L 


>>> 64.37541j + 4.23-8.53 


(68.605-7.53) 
>>> 041) ** 2 
(71403) 

>>> 141j ** 2 
0j 

>>> (141j) ** 2 
2j 


# same as 0-*(1j**2) 


# same as 1-*(1j**2) 


注意 指数 操作 符 的 优先 级 高 于 连接 实 部 和 虚 部 的 + 号 操作 符 。 就 上 面 最 后 一 个 例子 来 说 ， 我 们 
人 为 的 加 上 了 括号 ， 这 就 改变 运算 顺序 ， 从 而 得 到 我 们 想 要 的 结果 。 


5.5.4 ”位 操作 符 (iE 


用 于 整 型 ) 


Python 整 型 支持 标准 位 运算 : 取 反 (—) ， 按 位 与 (&) 、 或 (|) fA ,以 及 左 移 


(<<) f$ (>>) 。Python 这 


这 样 处 理 位 运算 。 


e 负数 会 被 当成 正 数 的 2 进 制 补 码 处 理 。 


e 左 移 和 右 移 N 位 等 同 于 无 溢出 检查 的 2 的 N 次 徊 运算 : 2*N。 


e 对 长 整 型 来 说 ， 位 操作 符 使 用 一 种 经 修改 的 2 进 制 补 码 形式 ， 使 得 符号 位 可 以 无 限 向 


EA Ao 


取 反 (~) 运算 的 优先 级 与 数字 单 目 操作 符 相 同 ， 是 所 有 位 操作 符 中 优先 级 最 高 的 一 个 。 左 
移 和 右 移 运 前 的 优先 级 次 之 ， 但 低 于 加 减法 运算 。 与 、 或 、 异 或 运算 优先 级 最 低 。 所 有 位 操 


作 符 按 优先 级 高 低 列 在 表 5.4 中 。 


A54 
位 的 作 符 
~ma 
num] ««num2 


numi>>num2 





numl&num2 
num!^num2 


numi |num2 


下 面 是 几 个 使 用 整 型 30, 45, 603 47 


整 型 位 操作 符 
5» *& 
MAEM., vf GU. F9 - Oum 
numi 左 罗 num? (X 
num) 右 移 num? 位 
mml 与 num2 按 位 与 
num! R num2 


numi 与 num2 fi 或 


位 运算 的 例子 。 
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=>> 30 & 45 
12 

»»» 30 | 45 
63 

22> 45 & 60 
44 

>> 45 | 60 
61 

>>> e 
I 
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ND nono 
-46 

>>> 493 «€ I 
90 

> BO >> 2 
15 

poo 30 "* 45 
51 


5.6 ”内 建 函 数 与 工厂 函数 


5.6.1 标准 类 型 函数 


第 4 章 中 ， 我 们 介绍 了 cmp()、str() 和 type() 内 建 函 数 。 这 些 函 数 可 以 用 于 所 有 的 标准 类 型 。 
数字 对 象 来 说 ， 这 些 no 2 T A A 
的 类 型 。 


>>> emp(-6, 2) 

=1 

2»» Onp(-4.333333, -2.11828182B8) 
= 

>>> cmp(OxFF, 255) 

0 

>>> str(OxFF) 

"255! 

>>> str(55.3e2) 

Ong). D" 

>>> type (OxFF) 

«type 'int'» 

>>> type(98765432109876543210L) 
«type 'long'» 

>>> type(2-1)j) 

«type 'complex'» 


5.6.2 ”数字 类 型 函数 

Python 现 在 拥有 一 系列 针对 数字 类 型 的 内 建 函 数 。 一 些 函 数 用 于 数字 类 型 转换 ， 另 一 些 则 执 
行 一 些 常用 运 莫 。 

1. 转 换 工厂 函数 

苞 数 int()、long()、float() 和 complex() 用 来 将 其 他 数值 类 型 转换 为 相应 的 数值 类 型 。 从 Python 
1.5 版 本 开始 ， 这 些 函 数 也 接受 字符 串 参 数 ， 返 回 字符 串 所 表示 的 数值 。 从 Python 1.6 版 开 
始 ，int() 和 |ong() 在 转换 字符 串 时 ， 接 受 一 个 进 制 参数 。 如 果 是 数字 类 型 之 间 的 转换 ， 则 这 个 
进 制 参数 不 能 使 用 。 


从 Pythori2.2 起 ， 有 了 第 5 个 内 建 函 数 bool()。 它 用 来 将 整 型 值 1 和 0 转换 为 标准 布尔 值 True 和 
Falseo 从 Python2.3 开 始 ，Python 的 标准 数据 类 型 添加 了 一 个 新 成 员 : 布尔 (Boolean ) X 
型 。 从 此 true 和 false。 现 在 有 了 常量 值 即 True 和 False (不 再 是 1 和 0) 。 要 了 解 布尔 类 型 的 更 
多 信息 ， 参 阅 5.7.1 小 节 。 


另外 ,由 于 Python 2.2 对 类 型 和 类 进行 了 整合 (这 里 指 Python 的 传统 风格 类 和 新 风格 类 一 译 者 
iR) ， 所 有 这 些 内 建 函 数 现在 都 转变 为 工厂 函数 。 我 们 曾经 在 第 4 章 介 绍 过 工厂 函数 ， 所 谓 工 
厂 函 数 就 是 指 这 些 内 建 泡 数 都 是 类 对 象 ， 当 你 调用 它们 时 ， 实 际 上 是 创建 了 一 个 类 实例 。 


不 过 不 用 担心 ， 这 些 函 数 的 使 用 方法 并 没有 什么 改变 。 
下 面 是 一 些 使 用 内 建 函数 的 示例 。 


>>> int(4.25555) 
>>> long(42) 


>>> float(4) 

4.0 

>>> complex(4) 

(4-03) 

>>> 

>>> complex(2.4, -8) 
(2.4-83) 

>>> 

>>> complex(2.3e-10, 45.364) 
(2.3e-10+453000j) 


表 5.5 是 数值 工厂 函数 总 结 。 
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表 5.5 数值 工厂 函数 " 
类 (工厂 函数 》 E ft 
bool(obj)" 返回 obj 对 象 的 布尔 值 ， 也 就 是 obj noazero 07/303 IPLE 
int(obj,base=10) E LEN HER string.atoi(); A Python 1.6 起 ， 引 入 了 
long( obj. 10) no — 743. string.atol().. M Pythonl.6 起 ， 引 入 了 
float(obi) 3X I 71308 9 A ORO $0977 PV GR, HU. string atoff ) 
complextsti)or compleal.ineg«0.0) EE PN 或 者 根 状 给 定 的 实数 《及 一 个 可 选 的 虚数 都 分 》 生 成 


a. 在 Python23 之 前 ， 这 些 都 是 内 建 函 数 
b. Python22 中 新 增 的 内 建 活 数 ， 在 Python2.3 "PCS TT RI 


2. 功 能 函数 


Python 有 54-3& JE AR RAA T 348 35 : abs()、coerce()、divmod()、pow()、pow() 和 
round() 。 我 们 将 对 这 些 函 数 逐 一 浏览 ， 并 给 出 一 些 有 用 的 例子 。 


abs() 返 回 给 定 参数 的 绝对 值 。 如 果 参 数 是 一 个 复数 ， 那 么 就 返回 math.sqrt (num.real2 + 
num.imag2) ° T 6 Æ JL abs() $ žá zs f| o 


>>> abs(-1) 

1 

>>> abs (10) 

10.0 

55» abs (1:2-82 713) 
2.41867732449 


25» aps (0:23 = Qe f6) 
Du 55 


函数 coerce()， 尽 管 从 技术 上 讲 它 是 一 个 数据 类 型 转换 函数 ， 不 过 它 的 行为 更 像 一 个 操作 符 ， 
因此 我 将 它 放 到 了 这 一 小 节 。 在 5.5.1 小 节 ， 我 们 讨论 了 Python 如 何 执行 数值 类 型 转换 。 函 数 
coerce () 为 程序 员 提 供 了 不 依赖 Python 解释 器 ， 而 是 自 定义 两 个 数值 类 型 转换 的 方法 。 对 一 

种 新 创建 的 数值 类 型 来 说 ， 这 个 特性 非常 有 有 用。 函数 coerce() 仅 返回 一 个 包含 类 型 转换 完毕 的 
两 个 数值 元 素 的 元 组 。 下 面 是 几 个 例子 。 


第 5 章 ”数字 142 


lo 05g XU AS J 
Python 核心 编程 h 


>>> coerce(1, 2) 

(Ll x) 

SS 

>>> coerce(1.3, 134L) 
(1.3; 1341.0] 

22» 

>>> coerce(1, 134L) 
(1L, 134L) 

222 

>>> coerce(1j, 134L) 
(13, (1344*03)) 

»»» 

>>> coerce(1.23-41j, 134L) 
((1.23-413), (134-0j3)) 


divmod() 内 建 函 数 把 除法 和 取 余 运算 结合 起 来 ， 返 回 一 个 包含 商 和 余数 的 元 组 。 对 整 型 来 说 ， 
它 的 返回 值 就 是 地 板 除 和 取 余 操作 的 结果 。 对 浮 点 型 来 说 ， 返 回 的 商 部 分 是 math.floor 
(num1/num2) ,对 复数 来 说 ， 商 部 分 是 ath.floor ( (numl/num2) .real) 。 


>>> divmod(10,3) 


(3, 1) 

>>> divmod(3,10) 
(0,3). 

»»» divmod(10,2.5) 
(4.0, 0.0) 

=>> divmod(2.5,10) 
(0:0, 2.5) 


>>> divmod(24*13j, 0.5-13) 
(03, (2411)] 


函数 pow() 和 双星 号 (**). 操作 符 都 可 以 进行 指数 运算 。 不 过 二 者 的 区 别 并 不 仅仅 在 于 一 个 是 
操作 符 ， 一 个 是 内 建部 数 。 


在 Python 1.5 之 前 ， 并 没有 ** 操 作 符 。 内 建 函 数 pow() 还 接受 第 三 个 可 选 的 参数 ， 即 一 个 余数 
参数 。 如 果 有 这 个 参数 的 ，pow() 先 进行 指数 运算 ， 然 后 将 运算 结果 和 第 三 个 参数 进行 取 余 运 
算 。 这 个 特性 主要 用 于 密码 运算 ， 并 且 比 pow (X，y) % z 性 能 更 好 ， 这 是 因为 这 个 函数 的 实 
现 类 似 于 C 函 数 pow (x*y^z) > 

>>> POW (2735) 

> 

>>> DOW(5,2) 


io 


>>> pow(3.141592, 2) 
9.86960029446 

>>> 

»»» pow(ltl]j,..3) 

(-2*2]) 
内 建 函 数 mund() 用 于 对 浮 点 型 进行 四 含 五 入 运算 。 它 有 一 个 可 选 的 小 数位 数 参 数 。 如 果 不 提 


供 小 数位 参数 ， 它 返回 与 第 一 个 参数 最 接近 的 整 型 【但 仍然 是 浮 点 类 型 ) 。 第 二 个 参数 告诉 
round 元 数 将 结果 精确 到 小 数 点 后 指定 位 数 。 
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>>> round(3) 
>>> round(3.45) 
>>> round(3.4999999) 
>>> round(3.4999999, 1) 


>>> import math 
>>> for eachNum in range(10): 


print round(math.pi, eachNum) 


.0 

zl 

.14 

.142 

.1416 

.14159 

.141593 
.1415927 
.14159265 
.141592654 
.1415926536 
>>> round(-3.5) 
-4.0 

>>> round(-3.4) 
-3.0 

»»» round(-3.49) 
-3.U 

>>> round(-3.49, 1) 
-3.5 


C UU GO LL) GO Lt GO L2 Lt UL UL 


值得 注意 的 是 round() 函 数 是 按 四 含 五 入 的 规则 进行 取 整 。 也 就 是 round (0.5) 得 到 1, round 
(-0.5) 得 到 -1。 猛 一 看 int()、round()、math.floor() 这 几 个 函数 好 像 做 的 是 同一 件 事 ， 很 容 
易 将 它们 弄 混 ， 是 不 是 ?下 面 列 出 它们 之 间 的 不 同 之 处 。 


。 函数 int() 直 接 截 去 小 数 部 分 (返回 值 为 整 型 ) 。 
e 函数 floor() 得 到 最 接近 原 数 但 小 于 原 数 的 整 型 (返回 值 为 浮 点 型 ) o 
e 函数 round() 得 到 最 接近 原 数 的 整 型 (返回 值 为 浮 点 型 ) 。 


下 面 的 例子 用 4 个 正 数 和 4 个 负数 作为 这 三 个 函数 的 参数 ， 将 返回 结果 列 在 一 起 做 个 比较 (为 
了 便于 比较 我 们 将 int() 函 数 的 返回 值 也 转换 成 了 浮 点 型 ) o 


LEA XLoc 
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»»» import math 
»»» for eachNum in (.2;, .7, 1.2, 1.7, —.2, —.7, -1.2, -1.7)i 


nx print "int(5.1f)Nt$*,1f" $ (eachNum, float(int(each- Num))) 
vx print "floor($.1f)NVt$*.1f" $ (eachNum, 

"s. math.floor(eachNum)) 

TE print "round(%.1f) \t%+.1f" % (eachNum, round(eachNum)) 

vs print '-' * 20 

int(0.2) *0.0 


floor(0.2)  *0.0 
round(0.2) *0.0 
int(0.7) *0.0 
floor(0.7)  *0.0 
round(0.7) *1.0 
int(1.2) *1.0 
floor(1.2)  *1.0 
round(1.2) *1.0 
int(1.7) *1.0 
floor(1.7) *1.0 
round(1.7)  *2.0 
int(-0.2) 40.0 
floor(-0.2) -1.0 
round(-0.2) +0.0 
int(-0.7) *0.0 
floor(-0.7) -1.0 
round(-0.7) -1.0 
int(-1.2) -1.0 
floor(-1.2) -2.0 
round(-1.2) -1.0 
int(-1.7) -1.0 
floor(-1.7) -2.0 
round(-1.7) -2.0 


表 5.6 是 数值 运算 函数 一 览 。 


m 5.6 数值 运算 内 建 函数 ” 


coerce(numl,num?) 将 num] 和 num2 转 接 为 同一 类 型 ， 然 后 以 一 个 元 组 的 形式 返回 
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m 
& e 3j se 


— on 





NU -NSusmSM. xu Tl numinum, numi % num?) . IT RM 


divmod(num | ,num2 ) 商 进行 Fd EUNANA o0.) 





powinum!,num2,mod^ I) 到 numl (f) num2 次 方 ， 如 虹 提 供 mod 参数 ， 则 计算 站 果 再 对 mod ERREN 
— + 





接受 对 其 四 今 位 不 提供 BRE WU 
roundiflt,ndig 1) 接受 一 个 浮 点 型 m 并 对 其 四 含 五 入 ， 保 存 ndig 位 小 数 。 若 tndig Sc. MRU 





a. round() 仅 用 于 评点 型 〈 详 者 注 ， 整 型 也 可 以 ， 不 过 它 并 设 有 什么 实 味 意 义 ) ， 


5.6.8 ” 仅 用 于 整 型 的 函数 


除了 适应 于 所 有 数值 类 型 的 内 建 函 数 之 外 ，Python 还 提供 一 些 仅 适用 于 整 型 的 内 建 函 数 〈 标 
准 整 型 和 长 整 型 ) 。 这 些 函 数 分 为 两 类 ， 一 类 用 于 进 制 转换 ， TE 类 用 于 ASCII 转 换 。 


1. 进 制 转换 函数 


前 面 我 们 已 经 看 到 ， 除 了 十 进 制 标准 ，Python 整 型 也 支持 八进制 和 十 六 进 制 整 弄 
外 ，Python 还 提供 了 两 个 内 建 泡 数 来 返回 字符 串 表 示 的 八进制 和 十 六 进 oe 
oct() 和 hex()。 它 们 都 接受 一 个 整 型 (任意 进 制 的 ) 对 象 ， 并 返回 一 个 对 应 值 人 
下 面 是 几 个 示例 。 


f MION TA "S mIE 用 一 /以 
) 


>>> hex (255) 
"OxrIT' 

>>> hex(230948231) 
'0x1606627L' 

>>> hex(65535*2) 
"Oxlfftfe' 

SS 

>>> Out (255) 
PSF" 

>>> wot (230948231) 
'0130063047L' 

2s» GGCtL65535*2) 
"OSI 


2. ASCII 转 换 函 数 


Python 也 提供 了 ASCII (美国 标准 信息 交换 码 ) 码 与 其 序列 值 之 间 的 转换 函数 。 每 个 字符 对 
应 一 个 唯一 的 整 型 (0—255) 。 对 所 有 使 用 ASCII 表 的 计算 机 来 说 ， 这 个 数值 是 不 变 的 。 这 保 
证 了 不 同系 统 之 间 程 序 行为 的 一 致 性 。 函 数 chr() 接 受 一 个 单字 节 整 型 值 ， 返 回 一 个 字符 串 ， 
其 值 为 对 应 的 字符 。 函 数 ord() 则 相反 ， 它 接受 一 个 字符 ， 和 返回 其 对 应 的 整 型 值 。 
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P5» 
97 
22» 
65 
22» 
48 


> 


>>> 
'A' 
>>> 
'" Q' 


ord('a') 


ord('A') 


ord('Oo"*) 


chr (97) 


chr (65L) 


chr (48) 


表 5.7 列 出 了 用 于 整 型 类 型 的 所 有 内 建 函 数 。 


» 


仅 适 用 于 整 型 的 内 建 函 数 
的 作 
将 数字 转换 成 十 六 进 制 数 并 以 字符 中 形式 返回 
将 数学 转换 成 八进制 数 并 以 字 答 溃 形式 返回 
将 ASCH 值 的 数字 转换 成 ASCHI 字符 ， 查 围 肥 能 是 0 <= num <= 255 
接受 一 个 ASCI 或 Unicode 字符 〈 长 度 为 1 的 字符 串 ) ， 亚 回 相应 的 ASCII 值 或 Unicode (t 


接受 Unicode MIT, 返回 其 对 应 的 Unicode FIF. PEE (Pri GS IN HOM T- 0:09 Python I Kt 
T UCS2 3E UCS-A 
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5.7; 其 他 数字 类 型 


5.7.1 "pi" 


从 Python2.3 开 始 ， 布 尔 类 型 添加 到 了 Python 中 来 。 尽 管 布尔 值 看 上 去 是 “True” 和 “False”， 但 
是 事实 上 是 整 型 的 子 类 ， 对 应 与 整 型 的 1 和 0。 下 面 是 有 关 布 尔 类 型 的 主要 概念 。 


e. 有 两 个 永 不 改变 的 值 True 或 False。 
e 布尔 型 是 整 型 的 子 类 ， 但 是 不 能 再 被 继承 而 生成 它 的 子 类 。 
e 没有 ”nonzero 方法 的 对 象 的 默认 值 是 True 。 


e 对 于 值 为 零 的 任何 数字 或 空 集 ( 空 列 表 、 空 元 组 和 空 字典 等 ) 在 Python 中 的 布尔 值 都 是 
False ° 


e 在 数学 运算 中 ，Boolean 值 的 True 和 False 分 别 对 应 于 1 和 0 。 
e 以 前 返 型 的 大 部 分 标准 库 函 数 和 内 建 布尔 型 函数 现在 返回 布尔 型 。 
e True 和 False 现 在 都 不 是 关键 字 ， 但 是 在 Python 将 来 的 版 本 中 会 是 。 


所 有 Python 对 象 都 有 一 个 内 建 的 True 或 False 值 ， 对 内 建 类 型 来 说 ， 这 个 值 完 竟 是 True 还 是 
False 请 参阅 章节 4.3.2 中 的 核心 备注 。 下 面 是 使 用 内 建 类 型 布尔 值 的 一 些 例子 。 
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# intro 

>>> bool(1) 
True 

>>> bool (True) 
True 

>>> bool(0) 
False 

>>> bool('l1') 
True 

>>> bool('0') 
Irue 

>>> bool([]) 
False 

250 bool ( (yy 


) 
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True 


à 使 用 布尔 数 

»»» foo = 42 

»»» bar = foo < 100 
»»» bar 

True 

»»» print bar * 100 
101 

>>> print '$s' * bar 
True 

>>> print '$d' % bar 
l 


& X  nonzero () 
»»» class C: pass 
>>> c = Cl() 

>>> 

>>> bool (c) 

True 

>>> bool (C) 


True 


# RR _nonzero_() 使 它 返 回 False 
>>> class C: 
def nonzero (self): 


return False 


>>> c = C() 
»»» bool(c) 
False 

>>> bool(C) 


True 


iR, HRAFN (无 论 如 何不 要 这 么 干 ! ) 
>>> True, False - False, True 

»»» bool(True) 

False 

>>> bool(False) 


True 


你 可 以 在 Python 文档 和 PEP 285 看 到 有 关 布 尔 类 型 的 知识 。 


5.7.2 十 进 制 浮 点 型 


从 Python2.4 起 (参阅 PEP327) 十 进 制 浮 点 制 成 为 一 个 Python 特 性 。 这 主要 是 因为 下 面 的 语 


名 经 常会 让 一 些 编写 科学 计算 或 金融 应 用 程序 的 程序 员 发 狂 。 
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sc D.Il 
0.1000000000000001 


为 什么 会 这 样 ? 这 是 因为 语言 绝 大 多 数 C 语 言 的 双 精 度 实 现 都 遵守 IEEE 7543015 » X 524 
用 于 底 。 因 此 浮 点 值 只 能 有 52 位 精度 ， 类 似 这 样 的 值 的 二 进 制 表示 只 能 象 上 面 那 样 被 截断 。 
0.1 的 二 进 制 表示 是 0.11001100110011...*2**-3, 因 为 它 最 接近 的 二 进 制 进 似 值 是 
0.0001100110011..., 或 1/116 + 1/32+1/256+... 


你 可 以 看 到 ， 这 些 片段 不 停 的 重复 直到 舍 入 出 错 。 如 果 我 们 使 用 十 进 制 来 做 同样 的 事情 ， 感 
觉 就 会 好 很 多 ， 看 上 去 会 有 任意 的 精度 。 注 意 下 面 ， 你 不 能 混用 十 进 制 浮 点 型 和 普通 的 浮 点 
型 。 你 可 以 通过 字符 串 或 其 他 十 进 制 数 创建 十 进 制 数 浮 点 型 。 必 须 导 入 decimal 模 块 以 便 使 用 
Decimal X 。 


from mal import i 
m i 
Trà K (m cer t 
F i 
F pyt 1 mi r wW 
r inn i 
TypeErr r er à e F c he à 
à rir 
dec ima L') 
je 
ma ZU 
> print di 
* 1. 
back (m r 
i "«st f à 
i ' /u: ca yt m d» i G j 
r Ony her ( 
u ioca il yt in < l 
rt r 
F I Y t ) ima wit r 
lecima 1 lata p 
T I Y f wit! [ a a p 
ec * ima 
ecimal!( " 
print * m ( 


你 可 以 从 Python 文档 中 读 取 相 关 的 PEP 以 了 解 十 进 制 数 。 值 得 庆幸 的 是 ， 十 进 制 数 和 其 他 数 
值 类 型 一 样 ， 可 以 使 用 同样 的 算术 操作 符 。 由 于 十 进 制 数 本 质 上 是 一 种 用 于 数值 计算 的 特殊 
类 ， 我 们 在 本 章 的 剩余 部 分 将 不 再 专门 讲解 十 进 制 数 。 
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5.8 相关 模块 


在 Python 标准 库 中 有 不 少 专门 用 于 处 理 数值 类 型 对 象 的 模块 ， 它 们 增强 并 扩展 了 内 建 函 数 的 
功能 和 数值 运算 的 功能 。 表 5.8 列 出 了 几 个 比较 核心 的 模块 。 要 详细 了 解 这 些 模 块 ， 请 参阅 这 
些 模块 的 文献 或 在 线 文档 。 


对 高 级 的 数字 科学 计算 应 用 来 说 ， 你 会 对 著名 的 第 三 方 包 Numeric (NumPy) 和 SciPy 感 兴 
趣 。 关 于 这 两 个 包 的 详细 请 访问 下 面 的 网 址 。 


http://humeric.scipy.org/ 
http://scipy.org/ 
X58 数字 类 型 相关 模块 
s su ^ d 
decimal FMI Aus W^ Decimal 
array 高 效 数 值 数组 《字符 、 整 型 、 浮 点 型 等 ) 
math/cmath 标准 CERENA. SRECFIRTEE match 模块 ， 复 数 运算 在 cmath 模块 
operator MERA. Wn torsub(man) $T. m -n 
random 多 种 念 瑚 机 数 生成 器 


oe 





核心 模块 : random 


当 你 的 程序 需要 随机 数 功 能 时 ，random 模 块 就 能 派 上 用 场 。 该 模块 包含 多 个 伪 随 机 数 发 生 
器 ， 它 们 均 以 当前 的 时 间 惟 为 随机 数 种 子 。 这 样 只 要 载 入 这 个 模块 就 能 随时 开始 工作 。 下 面 


列 出 了 该 模块 中 最 常用 的 函数 。 
randint() 两 个 整 型 参数 ， 返 回 二 者 之 间 的 随机 整 型 
randrange() 它 接受 和 range() 函 数 一 样 的 参数 , 随机 返回 range([start,]stop[,step]) 结 果 的 一 项 
uniform() JUFA randint() HF, BLEEE A (üt) — 9/508. CIGURSRUM I-RD 
random() 类 似 于 uniform0， 只 不 过 下 限 桓 等 于 0.0, ERST L0 


choice() 随机 返回 给 定 序列 《〈 关 于 序列 ， 见 第 6 章 ) 的 一 个 元 素 


到 此 ， 我 们 的 Python 数 值 类 型 之 旅 就 该 结束 了 。 表 5.9 总 结 了 数值 类 型 的 所 有 内 建 防 数 和 操作 
符 。 
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m 5.9 数值 类 型 操作 符 和 内 建 函数 
wm | | ~ | :| Ll 
www | ， | | | | e 
maws | - |- |- | — | ——L-- 
-— aer| - | : | : | - | 
a | me | - | - | - | - | 党 
wo [maa] - | - | - | - [| 必 
mo  [amwm| - | - | | Ll * 
« [sa] - | - | - | - | * 
co  [wmra| - | - | - | - | 局 
- |w]|-]-]1- |- |* 
w || | |o] hn 
e [| | |] 1 Le 
- | wm] 1 1 | | * 
"X 
armas | m a |e vw|kem| mum uoc 
-= | wn | -| .| = 
”ww 和 lv |， | — 
P | 4E I x 2 = 
s i int/long 
number 


x 


A 
Rt 


MEJE 
TMMBPBHBPE 
E|*&|&|9|S|8 | 
gx 

m 


» 位 右 移 
& 按 位 与 运算 
按 位 拭 或 运算 
| 按 位 或 运算 
a, ARA number 表示 可 以 为 所 有 由 种 数值 尖山， 可 能 与 操 从 数 相同 
b.** 与 单 朋 的 作 符 有 特殊 关系 ， 参 阅 553 RRS2 
e. MAM 


| 


5.9 练习 


本 章 的 练习 可 以 先 通 过 应 用 程序 的 形式 实现 。 一 旦 功能 齐备 并 且 调 试 通过 ， 建 议 读者 将 自己 
的 代码 功能 用 函数 封装 起 来 ， 以 便 在 后 面 的 练习 中 重用 代码 。 关 于 编程 风格 我 在 这 儿 提 醒 一 
下 ， 最 好 不 要 在 函数 内 使 用 print 语 句 输出 信息 ， 而 是 通过 return 语 名 返回 必要 的 值 。 这 样 调用 
函数 的 代码 就 可 以 自己 处 理 显示 方式 。 这 样 你 的 代码 就 适应 性 更 广 ， 更 便于 重用 。 
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5-1. 整 形 。 讲 讲 Python 普 通 整 型 和 长 整 型 的 区 别 。 
5-2. 操 作 符 。 
(a) 写 一 个 函数 ， 计 算 并 返回 两 个 数 的 乘积 。 
(b) 号 一 段 代码 调用 这 个 函数 ， 并 显示 它 的 结果 。 


5-3. 标 准 类 型 操作 符 。 写 一 段 脚本 ， 输 入 一 个 测验 成 绩 ， 根 据 下 面 的 标准 ， 输 出 他 的 评分 
成 绩 (A-F) 。 


A: 90~100 
B: 80~89 
C: 70~79 
D: 60~69 
F: <60 
5-4. 取 余 。 判 断 给 定年 份 是 否 是 头 年 。 使 用 下 面 的 公式 。 


一 个 头 年 就 是 指 它 可 以 被 4 整除 ， 但 不 能 被 100 整 除 ， 或 者 它 既 可 以 被 4 又 可 以 被 100 
整除 。 比 如 1992 年 、1996 年 和 2000 年 是 头 年 ， 但 1967 年 和 1900 年 则 不 是 半年 。 下 
一 个 是 半年 的 整 世 纪 是 2400 年 。 


5-5. 取 余 。 取 一 个 任意 小 于 1 美元 的 金额 ， 然 后 计算 可 以 换 成 最 少 多 少 枚 硬币 。 硬 币 有 1 
美 分 、5 美 分 、10 美 分 、25 美 分 4 种 。1 美 元 等 于 100 美 分 。 举 例 来 说 ，0.76 美 元 换 萌 结 果 
应 该 是 3 枚 25 美 分 ，1 枚 1 美 分 。 类 似 76 枚 1 美 分 ，2 枚 25 美 分 +2 枚 10 美 分 +1 枚 5 美 分 +1 枚 1 
美 分 这 样 的 结果 都 是 不 符合 要 求 的 。 


5-6. 算 术 。 写 一 个 计算 器 程序 。 你 的 代码 可 以 接受 这 样 的 表达 式 ， 两 个 操作 数 加 一 个 操作 
符 : N1 操 作 符 N2。 其 中 N1 和 N2 为 整 型 或 浮 点 型 ， 操 作 符 可 以 是 +、-、*、/、%、**， 分 
别 表 示 加 法 、 减 法 、 乘 法 、 整 型 除 、 取 余 筑 运 莫 。 计 算 这 个 表达 式 的 结果 ， 然 后 显示 
出 来 。 提 示 : 可 以 使 用 字符 串 方 法 split()， 但 不 可 以 使 用 内 建 函数 eval() 。 


5-7. 营 业 税 。 随 意 取 一 个 商品 金额 ， 然 后 根据 当地 营业 税额 度 计算 应 该 交纳 的 营业 税 。 
5-8. 几 何 。 计 算 面 积 和 体积 。 

(a) 正方 形 和 立方 体 

(b) 圆 和 球 
5-9. 数 值 形式 回答 下 面 关 于 数值 格式 的 问题 : 


(a) 为 什么 下 面 的 例子 里 17+32 等 于 49， 而 017+32 等 于 47,017+032 等 于 41? 
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2 
49 
ec DILJ de $2 
47 
x2 ULI * US 
41 
(b) 为 什么 下 面 这 个 表达 式 我 们 得 到 的 结果 是 134L 而 不 是 1342? 
s» SOL t 7RL 
134L 


5-10. 转 换 。 写 一 对 函数 来 进行 华氏 度 到 摄氏 度 的 转换 。 转 换 公 式 为 C= (F-32) * (5/9) E 
在 这 个 练习 中 使 用 莫 正 的 除法 ， 否 则 你 会 得 到 不 正确 的 结果 。 
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5-11. 取 余 。 
(a) 使 用 循环 和 算术 运算 ， 求 出 0~20 之 间 的 所 有 偶数 。 
(b) 同上 ， 不 过 这 次 输出 所 有 的 奇数 。 
(c) 综合 (a) 和 (b) ， 请 问 状 别 奇 数 和 偶数 的 最 简单 的 方法 是 什么 ? 


(d) 使 用 (c) 的 成 果 ， 写 一 个 函数 ， 检 测 一 个 整 型 能 否 被 另 一 个 整 型 整除 。 先 要 
求 用 户 输 入 两 个 数 ， 然 后 你 的 函数 判断 两 者 是 否 有 整除 关系 ， 根 据 判 断 结 果 分 别 返 
回 True 和 False。 


5-12. 系 统 限 制 。 写 一 段 脚本 确认 一 下 你 的 Python 所 能 处 理 的 整 型 、 长 整 型 、 浮 点 型 和 复 
数 的 范围 。 


5-13. 转 换 。 写 一 个 函数 把 由 小 时 和 分 钟表 示 的 时 间 转 换 为 只 用 分 钟表 示 的 时 间 。 


5-14. 银 行 利息 。 写 一 个 函数 ， 以 定期 存款 利康 为 参数 ， 假 定 该 账户 每 日 计算 复 利 ， 请 计 
算 并 返回 年 回报 率 。 


5-15. 最 大 公约 数 和 最 小 公 倍 数 。 请 计算 两 个 整 型 的 最 大 公约 数 和 最 小 公 倍 数 。 

5-16. 家 庭 财 务 。 给 定 一 个 初始 金额 和 月 开销 数 ， 使 用 循环 ， 确 定 剩 下 的 金额 和 当月 的 支 
出 数 ， 包 括 最 后 的 支出 数 。Payment() 函 数 会 用 到 初始 金额 和 月 额度 ， 输 出 结果 应 该 类 似 
下 面 的 格式 (例子 中 的 数字 仅 用 于 演示 ) 。 

Enter opening balance: 100.00 


Enter monthly payment: 16.13 
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Amount Remaining 


Balance 


19.35 


3 
0.00 


5-17.* 随 机 数 。 熟 读 随机 数 模 块 然后 解 下 面 的 题 。 


生成 一 个 有 NN 个 元 素 的 由 随机 数 n 组 成 的 列表 ， 其 中 N 和 n 的 取 值 范围 分 别 为 (1< N 
<= 100) 和 (0<=n<=2**31 -1) 。 然 后 再 随机 从 这 个 列表 中 取 N (1<=N<=100) 个 
随机 数 出 来 ， 对 它们 排序 ， 然 后 显示 这 个 子 集 。 
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$63 ”序列 : 字符 串 、 列 表 和 元 组 


e FHF 
4 列表 
4 元 组 
Eo AE C END EU maa ECT 
量 访问 到 它 的 一 个 或 者 几 个 成 员 ， 这 类 Python 类 型 统称 为 序列 ， 包 括 字 符 串 《普通 字符 串 和 


unicode 字 符 串 ) 、 列 表 和 元 组 类 型 。 


因为 这 些 类 型 其 实 都 是 由 一 些 成 员 共同 组 成 的 一 个 序列 整体 ， 所 以 我 们 把 它们 统称 为 序列 ， 
比如 说 ， 一 个 字符 串 是 由 一 些 字符 (尽管 Python 并 没有 显 式 地 定义 字符 这 个 类 型 ) 组 成 的 序 
列 ， 那 么 “Hello” 这 个 字符 囊 的 第 一 个 字符 就 是 “H”， 第 二 个 字符 就 是 '@”...， 同 样 的 ， 列 表 类 型 
和 元 组 类 型 就 是 其 他 一 些 Python 对 象 所 组 成 的 序列 。 


首先 我 们 来 熟悉 一 下 适用 于 所 有 序列 类 型 的 操作 符 和 内 建 函 数 (BIF) 再 对 每 一 种 从 如 下 方面 


分 别 介绍 ; 

e HT: 

e RR 

。 内 建 函 数 ; 

AERA (RTA) 


。 特性 (如 果 可 用 ) 
e 相关 模块 (如果 可 用 ) 。 


在 本 章 的 末尾 我 们 会 给 出 一 个 对 于 所 有 序列 类 型 都 适用 的 操作 符 和 有 函数 的 参考 图 表 ， 现 在 让 
我 们 概略 看 一 下 这 些 内 容 。 


0 1 2 N-2 N-1 
Sequence | | A | | ee. o [| It] 


-N — -(N-1) -(N-2) 2 4 


== length of sequence == 1en(sequence) 


图 6-1 有 多 少 可 以 保存 并 可 以 被 访问 的 序列 元 素 


6.4 F3 


序列 类 型 有 着 相同 的 访问 模式 : 它 的 每 一 个 元 素 可 以 通过 指定 一 个 偏 移 量 的 方式 得 到 。 而 多 
个 元 素 可 以 通过 切片 操作 的 方式 一 次 得 到 ， 切 片 操作 会 在 接 下 来 的 内 容 中 讲 到 。 下 标 偏 移 量 
是 从 0 开始 到 总 元 素数 -1 结束 一 一 之 所 以 要 减 1 是 因为 我 们 是 从 0 开始 计数 的 。 图 6-1 阅 述 了 序 
列 的 元 素 是 如 何 存储 的 。 


6.1.1 标准 类 型 操作 符 

标准 类 型 操作 符 (参见 4.5 节 ) 一 般 都 能 适用 于 所 有 的 序列 类 型 。 当 然 ， 如 果 作 复 合 类 型 的 对 
象 比较 的 话 ， 这 样 说 可 能 需要 有 所 保留 ， 不 过 其 他 的 操作 绝对 是 完全 适用 的 。 

6.1.2 序列 类 型 操作 符 

表 6.1 列 出 了 对 所 有 序列 类 型 都 适用 的 操作 符 。 操 作 符 是 按照 优先 级 从 高 到 底 的 顺序 排列 的 。 
1. 成 员 关 系 操作 符 (in、not in ) 


成 员 关 系 操 作 符 是 用 来 判断 一 个 元 素 是 否 属 于 一 个 序列 的 。 比 如 对 字符 串 类 型 来 说 ， 就 是 判 
断 一 个 字符 是 否 属于 这 个 字符 串 ; 对 和 元 组 类 型 来 说 ， 就 代表 了 一 个 对 象 是 否 属于 该 对 象 序 
列 。in/not in 操作 符 的 返回 值 一 般 来 讲 就 是 True/False， 满 足 成 员 关系 就 返回 True， 否 则 返回 
False。 该 操作 符 的 语法 如 下 。 


对 象 [not] in 序列 








表 6.1 序列 类 型 操作 符 
TUS EH " 
seq [ind] WN FEA ind PDC 
m seq [ indl:ind2 | E Fs indi 到 ind2 MWERA 

seq * expr | 序列 重复 expe 次 

seql + soq? pun IH seq! AI seq? 
0 m "2 "i obj CK IE GL E seq 中 
obj not in seq | PM obj 元 素 是 可 不 包含 在 seq 中 








2. 连接 操作 符 (9) 


这 个 操作 符 允 许 我 们 把 一 个 序列 和 另 一 个 相同 类 型 的 序列 做 连接 。 语 法 如 下 。 


sequencel + sequence2 


该 表达 式 的 结果 是 一 个 包含 sequence1 和 sequence2 的 内 容 的 新 序列 。 注 意 ， 这 种 方式 看 起 来 
似乎 实现 了 把 两 个 序列 内 容 合并 的 概念 ， 但 是 这 个 操作 不 是 最 快 或 者 说 最 有 效 的 。 

对 字符 囊 来 说 ， 这 个 操作 不 如 把 所 有 的 子 字符 串 放 到 一 个 列表 或 可 迭代 对 象 中 ， 然 后 调用 一 
个 join 方法 来 把 所 有 的 内 容 连 接 在 一 起 节约 内 存 ; 类 似 地 ， 对 列表 来 说 ， 我 们 推荐 读者 用 列表 
类 型 的 extend() 方 法 来 把 两 个 或 者 多 个 列表 对 象 合并 。 当 你 需要 简单 地 把 两 个 对 象 的 内 容 合 
并 ， 或 者 说 不 能 依赖 于 可 变 对 象 的 那些 没有 返回 值 (实际 上 它 返 回 一 个 None) 的 内 建 方法 来 
完成 的 时 候 时 ， 和 连接 操作 符 还 是 很 方便 的 一 个 选择 。 下 面 的 切片 操作 可 以 视 作 这 些 情况 的 例 
She 

3. 重复 操作 符 C) 


当 你 需要 需要 一 个 序列 的 多 份 找 贝 时 ， 重 复 操 作 符 非 常 有 用 ， 它 的 语法 如 下 。 
sequence * copies int 


copies int 必须 是 一 个 整 型 (1.6 节 里 面 有 讲 到 ， 不 能 是 长 整 型 ) 。 像 连接 操作 符 一 样 ， 该 操作 
符 返 回 一 个 新 的 包含 多 份 原 对 象 找 贝 的 对 象 。 

4. 切片 操作 符 CC) ，[ ，[::]) 

简单 地 讲 ， 所 谓 序列 类 型 就 是 包含 一 些 顺 序 排列 的 对 象 的 一 个 结构 。 你 可 以 简单 的 用 方 括号 
加 一 个 下 标的 方式 访问 它 的 每 一 个 元 素 ， 或 者 通过 在 方 括号 中 用 冒号 把 开始 下 标 和 结束 下 标 
分 开 的 方式 来 访问 一 组 连续 的 元 素 。 

下 面 我 们 将 详细 的 讲解 提 到 的 这 两 种 方式 。 序 列 类 型 是 其 元 素 被 顺序 放置 的 一 种 数据 结构 类 
型 ， 这 种 方式 允许 通过 指定 下 标的 方式 来 获得 某 一 个 数据 元 素 ， 或 者 通过 指定 下 标 范 围 来 获 
得 一 组 序列 的 元 素 。 这 种 访问 序列 的 方式 叫做 切片 ， 我 们 通过 切片 操作 符 就 可 以 实现 我 们 上 
面 说 到 的 操作 。 


访问 某 一 个 数据 元 素 的 语法 如 下 : 


sequence[index] 


sequence 是 序列 的 名 字 ，index 是 想 要 访问 的 元 素 对 应 的 偏 移 量 。 偏 移 量 可 以 是 正 值 。 范 围 从 
0 到 偏 移 最 大 值 ( 比 序列 长 度 少 一 ) > Men) hk (下 一 节 会 讲 ) ， 可 以 得 到 序列 长 度 ， 实 际 
的 范围 是 0<=index<=len (sequence) -1。 


另外 ， 也 可 以 使 用 负 索 引 ， 范 围 是 -1 到 序列 的 负 长 度 ，-len (sequence) > -len (sequence) 


<=index<=-1。 正 负 索 引 的 区 别 在 于 正 索 引 以 序列 的 开始 为 起 点 ， 负 索引 以 序列 的 结束 为 起 
点 3 


试图 访问 一 个 越界 的 索引 会 引发 一 个 如 下 的 异常 ; 


>>> names = ('Faye', 'Leanna', 'Daylen') 
>>> print names[4] 
Traceback (most recent call last): 

File "«stdin»", line 1, in ? 
IndexError: tuple index out of range 


因为 Python 是 面向 对 象 的 ， 所 以 你 可 以 像 下 面 这 样 直接 访问 一 个 序列 的 元 素 (不 用 先 把 它 赋 


值 给 一 个 变量 ) o 
>>> print ('Faye', 'Leanna', 'Daylen')[1] 
Leanna 


这 个 特性 在 你 调用 一 个 返回 值 是 序列 类 型 的 函数 ， 并 且 你 只 对 返回 的 序列 中 的 一 个 或 某 几 个 
元 素 感 兴趣 时 特别 有 用 。 


么 我 们 如 何 才能 一 次 得 到 多 个 元 素 呢 ? 其 实 这 跟 访 问 某 一 个 单一 元 素 一 样 简单 ， 只 要 简单 
的 给 出 开始 和 结束 的 索引 值 ， 并 且 用 冒号 分 隔 就 可 以 了 ， 其 语法 如 下 。 


sequence[starting index:ending index] 
这 种 方式 我 们 可 以 得 到 从 起 始 索 引 到 结束 索引 (不 包括 结束 索引 对 应 的 元 素 ) 之 间 的 


i cio ui 
操作 会 从 序列 的 最 开始 处 开始 ， 或 者 直到 序列 的 最 末尾 结 


在 图 6-2~ 图 6-6 里 面 ， 我 们 以 一 个 长 度 为 5 的 序列 为 例 ， 分 别 讲解 了 这 几 种 切片 方式 。 





E 6-3 序列 切片 操作 : sequence[0:3] X.sequence[:3] 





图 6-4 序列 切片 操作 : sequence[2:5] 或 sequence[2:] 





图 6-5 序列 切片 操作 : sequence[1:3] 








图 6-6 序列 切片 操作 : sequence[3] 
5. 用 步 长 索引 来 进行 扩展 的 切片 操作 


序列 的 最 后 一 个 切片 操作 是 扩展 切片 操作 ， 它 多 出 来 的 第 三 个 索引 值 被 用 做 步 长 参数 。 你 可 
人 、Perl、PHP 和 Java 
语言 里 面 for 语 名 中 的 步 长 参数 一 样 来 理解 。 


Python 的 虚拟 机 里 面 其 实 很 早 就 有 了 扩展 切片 操作 ， 只 不 过 以 前 需要 通过 扩展 的 方式 来 使 
用 。Jython 也 支持 这 个 语法 (以 前 叫 JPython) 。 


很 久 以 前 的 C 解 释 程 序 2.3 版 就 给 出 了 其 他 所 有 方法 。 
以 下 是 几 个 例子 。 


>>> s = 'abcdefgh' 


>>> s[::-1] & 可 以 视 作 "翻转 "操作 
'hgfedcba' 

>>> s[::2] E 隔 一 个 取 一 个 的 操作 
'aceg' 


6 切片 索引 的 更 多 内 容 


切片 索引 的 语法 要 比 简 单 的 单一 元 素 索引 灵活 得 多 。 开 始 和 结束 素 引 值 可 以 超过 字符 串 的 长 
度 。 换 多 话说 ， 起 始 索引 可 以 小 于 0， 而 对 于 结束 索引 ， ec 
不 会 报错 ， 简 单 地 说 ， 即 使 用 100 来 作为 一 个 长 度 不 到 100 的 序列 的 结束 索引 也 不 会 有 什么 
题 ， 例 子 如 下 。 


>>> ('Faye', 'Leanna', 'Daylen')[-100:100] 
('Faye', 'Leanna', 'Daylen') 


有 这 么 一 个 问题 : 有 一 个 字符 串 ， 我 们 想 通过 一 个 循环 按照 这 样 的 形式 显示 它 : 每 次 都 把 位 
于 最 后 的 一 个 字符 砍 掉 ， 下 面 是 实现 这 个 要 求 的 一 种 方法 。 

>>> s = 'abcde' 

>>> i - -1 


22» for i in range(-1, -len(s), -1): 
> print s[:i] 

abcd 

abc 


ab 
a 


可 是 ， 该 如 何在 第 一 次 迁 代 的 时 候 显示 整个 字符 串 呢 ? 是 否 有 一 种 方法 可 以 不 用 在 整个 循环 

之 前 加 入 一 个 额外 的 print 语 句 呢 ? 我 们 该 如 何 定义 一 个 索引 ， 来 代表 整个 的 序列 呢 ? 事实 上 

在 一 个 以 负数 作为 索引 的 例子 里 是 没有 一 个 真正 能 解决 这 个 问题 的 方法 的 ， 因 为 -1 已 经 是 “最 

小 "的 索引 了 。 我 们 不 可 能 用 0 来 作为 索引 值 ， 因 为 这 会 切片 到 第 一 个 元 素 之 前 而 什么 都 不 会 显 
eds 


»ow s[f:0] 


我 们 的 方案 是 使 用 另 一 个 小 技巧 : 用 None 作 为 索引 值 ， 这样 一 来 就 可 以 满足 你 的 需要 ， 比 如 
说 ， 在 你 想 用 一 个 变量 作为 索引 来 从 第 一 个 到 遍历 最 后 一 个 元 素 的 时 候 : 


>>> s = 'abcde' 
>>> for i in [None] + range(-1, -len(s), -1): 
print s[:i] 


现在 这 个 程序 符合 我 们 的 要 求 了 。 在 进行 下 面 的 内 容 之 前 ， 必 须 指出 ， 似 乎 还 可 以 先 创 建 一 
个 只 包含 None 的 列表 ， 然 后 用 extend() 函 数 把 range() 的 输出 添加 到 这 个 列表 ， 或 者 先 建立 
range() 输 出 组 成 的 列表 然后 再 把 None 插 入 到 这 个 列表 的 最 前 面 ， 然 后 对 这 个 列表 进行 遍历 ， 
但 是 可 变 对 象 的 内 建 函 数 extend() 根 本 就 没有 返回 值 ， 所 以 这 个 方法 是 行 不 通 的 。 


>>> for i in [None].extend(range(-1, -len(s), -1)): 


print s[:i] 


Traceback (most recent call last): 
File "«stdin»", line 1, in ? 


TypeError: iteration over non-sequence 


这 个 错误 发 生 的 原因 是 [None].extend (...) £c m None, None tE R Æ 7| KALT ZETA 
代 对 象 。 在 这 种 情况 下 使 用 上 面 提 到 的 列表 连接 操作 来 实现 是 唯一 不 需要 添加 额外 代码 的 方 
法 。 


6.1.3 4X (BIF) 


在 讲解 序列 类 型 的 内 建 函 数 之 前 ， 有 一 点 需要 说 明 ， 序 列 本 身 就 内 含 了 迭代 的 概念 ， 之 所 以 
会 这 样 ， 是 因为 迭代 这 个 概念 就 是 从 序列 ， 迁 代 器 ， 或 者 其 他 支持 迭代 操作 的 对 象 中 泛 化 得 
来 的 。 


由 于 Python 的 for 循 环 可 以 遍历 所 有 的 可 和 迭代 类 型 ， 在 (〈 非 纯 序 列 对 象 上 ) 执行 for 循 环 时 就 像 
在 一 个 纯 序 列 RAD 。 d 的 很 多 原来 只 支持 序列 作为 参数 的 内 建 函数 现在 
也 开始 支持 选 代 器 或 者 或 类 选 代 嚣 了。 我 们 把 这 些 类 型 统称 为“ 可 迭代 对 象 ”。 


在 这 一 章 里 我 们 会 详细 的 讨论 跟 序 列 关 系 紧密 的 内 建 函 数 (BIF) 。 在 第 八 章 “ 条 件 判 断 和 御 
环 ”" 里 面 将 讨论 针对 “在 循环 中 迭代 ”这 种 情况 的 内 建 函 数 (BIF) 。 

1. 类 型 转换 

内 建 函 数 list()、str() 和 tuple() 被 用 做 在 各 种 序列 类 型 之 间 转 换 。 你 可 以 把 它们 理解 成 其 他 语言 
里 面 的 类 型 转换 ， 但 是 并 没有 进行 任何 的 转换 。 这 些 转换 实际 上 是 工厂 函数 (在 第 4 章 介 


绍 ) ， 将 对 象 作 为 参数 ， 并 将 其 内 容 CX) 拷贝 到 新 生成 的 对 象 中 。 表 6.2 列 出 了 适用 于 序列 
类 型 的 转换 函数 。 





表 6.2 序列 类 型 转换 工厂 函数 
数 全 x 
tist Gte) ———— | EARURHR NHN 
str (obj) ET M ENS 
unicode (obj) 把 对 象 转换 成 Unicode TT. CHIESE] 
basestring( } | "m AR, ah IMEA str 和 unicode MERA., MUAF 
TELIA 也 Miet 详 见 第 6.2 1) 
tuple (iter) [及 pi TT 对 象 转换 成 \ 元 组 对 象 





我 们 又 用 了 一 次 “转换 * 这 个 词 。 不 过 ， 为 什么 Python 里 面 不 简单 地 把 一 个 对 象 转 换 成 另 一 个 对 
ZR? 回 过 头 看 一 下 第 4 章 就 会 知道 ， 一旦 一 个 Python 的 对 象 被 建立 ， 我们 就 不 能 更 改 其 身份 
或 类 型 了 。 如 果 你 把 一 个 列表 对 象 传 给 list() 函 数 ， 便 会 创建 这 个 对 象 的 一 个 浅 捞 贝 ， 然 后 将 其 
插入 新 的 列表 中 。 同 样 地 ， 在 做 连接 操作 和 重复 操作 时 ， 我 们 也 会 这 样 处 理 。 


所 谓 浅 拷贝 就 是 只 拷贝 了 对 对 象 的 索引 ， 而 不 是 重新 建立 了 一 个 对 象 。 如 果 你 想 完 全 的 拷贝 
一 个 对 象 ( 包括 递归 ， 如 果 你 的 对 象 是 一 个 包含 在 容器 中 的 容器 ) ， 你 需要 用 到 深 找 贝 ， 关 
于 浅 拷 贝 和 深 堵 贝 的 更 多 信息 会 在 本 章 的 末尾 讲 到 。 


str() 函 数 在 需要 把 一 个 对 象 的 可 打印 信息 输出 时 特别 有 用 ， 不 仅仅 是 对 序列 类 型 ， 对 其 他 类 型 
的 对 象 同样 如 此 。Unicode() 是 str() 驾 数 的 unicode 版 本 ， 它 跟 str() 部 数 基本 一 样 。|list() 和 
tuple() 驾 数 在 列表 类 型 和 元 组 类 型 的 互 换 时 非 党 有用。 不过， 虽然 这 些 函 数 也 适用 于 string 类 
型 (因为 string 类 型 也 是 序列 的 一 种 ) ， 但 是 在 string 类 型 上 应 用 tupleO 和 list() 函 数 却 得 不 到 我 
们 通常 希望 的 结果 


2. 可 操作 


Python 为 序列 类 型 提供 以 下 可 操作 BIF ( 见 表 6.3) iX > len() ` reversed()fesum() AAA f 
接受 序列 类 型 对 象 作 为 参数 ， 而 剩 下 的 则 还 可 以 接受 可 和 迭代 对 象 作为 参数 ， 另 外 ， n 
min() i Zi, T VA dE S6 — A AR CAL, e 























X 6.3 序列 类 型 可 用 的 内 建 函 数 
iR 名 | 
- t - 
cnumermetl iter) | ETARA SN. URSI T enumere 212. CM 6 TA 
| 30. USED Rer b] TCU) index 值 和 item 值 组 成 的 元 组 (PEP 279) 
+ - 
len. (seq) 返回 seq 00) CUI 
max (iter,key*None | HE iter E Carg0,arg1,..2 PORAN S HUE T key， 这 个 key DAR 
^ 4 i^ Faia, n3 1e]. ! 
or max(argÜ,arg l... key*None) 以 传 给 sot MEN., PIENO RN 
min (iter, key None i [ni iter "I i6 4 lin es (argO,argl,..) Tik n eoa T nu 
' ke kA key 必须 是 be 4 
or mis Cog, lm) f key, i key 必须 是 11688 son OER. M EE 
reversed (seq 接受 作为 参数 ， 如 同一 个 以 道 疮 访问 的 直 代 器 《PEP 322 
+ 
sorted ( iter, func 接受 一 个 可 选 代 对 象 作为 参数 ， 返 上 个 有 序 的 列表 :， 可 选 参数 
None, key * None, func. key 和 reverse 的 含义 跟 Dist. sort() A Bf if Y) 46 Tu 今 义 一 样 
reversesFalse) ' 
sum(seq, init)" Ei seq 和 可 选 参数 ini 的 总 和 ,其 效果 等 同 于 reducet operator.add,seq,init ) 
zie Lis0, iti.. 4N]) Bl t». IO TCR Os n1. BATRAN 1 CELL 
f. 93 T NER 





a. Python2.3 EUR 
b. M Pythoa25 7E Xr X Ut $m 
€. Python2.4 开始 支持 


d. Python2.0 加 入 ，Python2.4 


我 们 将 分 别 在 每 个 序列 的 章节 里 面 提供 使 用 这 些 函 数 的 例子 


6.2 T^t 


字符 串 类 型 是 Python 里 面 最 常见 的 类 型 。 我 们 可 以 简单 地 通过 在 引号 间 包 含 字符 的 方式 创建 
它 。 Python 里 面 单 引 号 和 双 引 号 的 作用 是 相同 的 ， 这 一 点 Python 不 同 于 其 他 类 Shell 的 脚本 语 
言 ， 在 这 些 脚 本 语言 中 ， 通 常 转 义 字符 仅仅 在 双 引 号 字符 串 中 起 作用 ， 在 单一 号 括 起 的 字符 
串 中 不 起 作用 。Python 用 "原始 字符 串 ? 操 作 符 来 创建 直接 量 字符 串 ， 所 以 再 做 区 分 就 没什么 意 
义 了 。 其 他 的 语言 ， 比 如 C 语 言 里 面 用 单 引 号 来 标示 字符 ， 双 引号 标示 字符 串 ， 而 在 Python 里 
面 没 有 字符 这 个 类 型 。 这 可 能 是 双 引 号 和 单 引 号 在 Python 里 面 被 视 作 一 样 的 另 一 个 原因 。 几 
乎 所 有 的 Python 应 用 程序 都 会 某 种 方式 用 到 字符 串 类 型 。 字 符 串 是 一 种 直接 量 或 者 说 是 一 种 
标量 ， 这 意味 着 Python 解释 器 在 处 理 字符 串 时 是 把 它 作 为 单一 值 并 且 不 会 包含 其 他 Python 类 
型 的 。 字 符 串 是 不 可 变 类 型 ， 就 是 说 改变 一 个 字符 串 的 元 素 需 要 新 建 一 个 新 的 字符 串 。 字 符 
串 是 由 独立 的 字符 组 成 的 ， 并 且 这 些 字符 可 以 通过 切片 操作 顺序 地 访问 。 


根据 在 2.2 节 里 面 对 类 型 和 类 的 概念 进行 的 统一 ，Python 实 际 上 有 三 类 字符 串 。 通 常 意义 的 字 
符 串 〈str) 和 Unicode 字 符 串 〈unicode) 实际 上 都 是 抽象 类 basestring 的 子 类 。 这 个 
basestring 是 不 能 实例 化 的 ， 如 果 你 试图 实例 化 一 个 basestring 类 ， 你 会 得 到 以 下 报错 信息 。 


1. 字符 串 的 创建 和 赋值 


创建 一 个 字符 串 就 像 使 用 一 个 标量 一 样 简单 ， 当 然 你 也 可 以 把 str() 作 为 工厂 方法 来 创建 一 个 字 
符 串 并 把 它 赋值 给 一 个 变量 。 


>> aString 'Hello World!' 上 使 用 单 引 号 
> anotherString = "Python i ool!" # 使 用 双 引 号 
> print aString # print 不 带 引 名 的 Hello World 
l Worinil 
> anotherString # 不 是 进行 print 操作 ， 带 有 引号 
1Pyti | l:' # 把 一 个 列表 转换 成 一 个 字符 中 


2. 如 何 访问 字符 串 的 值 (字符 和 子囊 ) 


Python 里 面 没有 字符 这 个 类 型 ， 而 是 用 长 度 为 1 的 字符 串 来 表示 这 个 概念 ， 当 然 ， 这 其 实 也 是 
一 个 子囊 。 用 方 括号 加 一 个 或 者 多 于 一 个 索引 的 方式 来 获得 子 串 ; 


>>> aString = "Hello World!' 
»»» aString[0] 


' H' 
2» astrinq[ls5] 
'ello' 


»»» aString[O6:] 
'World!' 


3. 如 何 改 变 字符 囊 


你 可 以 通过 给 一 个 变量 赋值 (或 者 重 赋值 ) 的 方式 “更 新 "一 个 已 有 的 字符 串 。 新 的 值 可 能 与 原 
有 值 差 不 多 ， 也 可 能 跟 原 有 串 完全 不 同 。 

>>> aString = aString[:6] + 'Python!' 

>>> aString 

'Hello Pythonl 

>>> aString = 'different string altogether' 

>>> aString 

'different string altogether' 
跟 数 字 类 型 一 样 ， 字 符 串 类 型 也 是 不 可 变 的 ， 所 以 你 要 改变 一 个 字符 串 就 必须 通过 创建 一 个 
新 串 的 方式 来 实现 。 也 就 是 说 你 不 能 只 改变 一 个 字符 串 的 一 个 字符 或 者 一 个 子囊， 然而 ， 通 
过 拼凑 一 个 盏 串 的 各 个 部 分 来 得 到 一 个 新 串 是 被 允许 的 ， 正 如 上 面 你 看 到 的 那样 。 
4. 如 何 删除 字符 和 字符 串 
再 重复 一 遍 ， 字 符 串 是 不 可 变 的 ， 所 以 你 不 能 仅仅 删除 一 个 字符 串 里 的 某 个 字符 ， 你 能 做 的 
是 清空 一 个 空 字符 串 ， 或 者 是 把 别 除 了 不 需要 的 部 分 后 的 字符 串 组 合 起 来 形成 一 个 新 串 。 假 
设 你 想 要 从 “Hello World!" 里 面 删除 小 写 的 “1”。 

>>> aString = 'Hello World!' 

>>> aString 

>>> aString 

'Helo World!' 


aString[:3] + aString(4:] 


通过 赋 一 个 空 字 符 串 或 者 使 用 del 语 名 来 清空 或 者 删除 一 个 字符 串 : 


225» aString = '' 
>>> aString 


>>> del aString 


在 大 部 分 应 用 程序 里 » 没有 必要 显 式 的 删除 字符 串 o 定义 这 个 字符 串 的 代码 最 终 会 结束 E: 
时 Python 会 自动 释放 这 些 字符 串 。 


6.3 ”字符 串 和 操作 符 


6.3.1 标准 类 型 操作 符 


在 第 4 章 里 面 ， 我 们 介绍 了 一 些 适 用 于 包括 标准 类 型 在 内 的 大 部 分 对 象 的 操作 符 ， 在 这 里 再 看 
一 下 其 中 的 一 些 操作 符 是 怎样 作用 于 字符 串 类 型 的 ， 下 面 是 几 个 简单 的 例子 。 


>>> strl = 'abc' 
>>> StrZ = 'limn' 
>>> str3 = 'xyz' 


>>> strl < str2 


True 

>>> strZ2 l= str3 

True 

22» Strl < str3 and str2 =a 'xyz' 
False 


在 做 比较 操作 的 时 候 ， 字 符 串 是 按照 ASCII 值 的 大 小 来 比较 的 。 


6.3.2 FIREA (OFE 


在 先前 的 6.1.1 节 里 面 我 们 展示 了 如 何 访 问 序列 类 型 的 一 个 或 一 组 元 素 ， 接 下 来 我 们 会 把 这 些 
知识 应 用 到 字符 串 类 型 上 ， 着 重 考察 以 下 的 操作 ; 


e 正 向 索引 ; 
e KARSI: 
e 默认 索引 。 


接 下 来 以 字符 串 'abcd' 为 例子 。 表 里 面 分 别 列 出 了 使 用 正 索 引 和 负 索 引 来 定位 字符 的 情况 。 可 
以 用 长 度 操 作 符 来 确认 该 字符 串 的 长 度 是 4。 


>>> aString = 'abcd' 
>>> len (aString) 
4 


正 向 索引 时 ， 索 引 值 开始 于 0， 结 束 于 总 长 度 减 1{〈 因 为 我 们 是 从 0 开始 索引 的 ) 。 本 例 中 最 后 


一 个 索引 是 : 


final index = len(aString) - 1 
—4-1] 
= 3 


在 这 个 范围 内 ， 我 们 可 以 访问 任意 的 子 串 。 用 一 个 参数 来 调用 切片 操作 符 结果 是 一 个 单一 字 
符 ， 而 使 用 一 个 数值 范围 (用 ) 作为 参数 调用 切片 操作 的 参数 会 返回 一 串 连 续 地 字符 。 再 强 
调 一 遍 ， 对 任何 范围 [start:end]， 我 们 可 以 访问 到 包括 start 在 内 到 end (不 包括 end) 的 所 有 字 
符 ， 换 钨 话说， 假设 X 是 [start:end] 中 的 一 个 索引 值 ， 那 么 有 : start<=x<end ° 
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>>> aString[0] 

ta! 

>>> aString[1:3] 

'"bpc' 

»»» aString[2:4] 

Ted! 

>>> aString[4] 

Traceback (innermost last): 
File "cabdin»", line 1, In 2 


IndexError: string index out of range 


使 用 不 在 允许 范围 (本 例 中 是 0 到 3) 内 的 索引 值 会 导致 错误 。 上 面 的 aString[2:4] 却 并 没有 出 
错 ， 那 是 因为 实际 上 它 返 回 的 是 索引 值 2 和 3 的 值 。 但 是 直接 拿 4 作 为 索引 访问 是 不 被 允许 的 。 


在 进行 反 向 索引 操作 时 ， 是 从 -1 开始 ， 向 字符 串 的 开始 方向 计数 ， 到 字符 串 长 度 的 负数 为 索引 
的 结束 。 最 末 一 个 索引 (也 就 是 第 一 个 字符 ) 是 这 样 定 位 的 : 


final index 


-len(aString) 


= 一 4 
> 
'q' 
>>> aString[-3:-1] 
'bc' 
>>> aString[-4] 
ai 


如 果 开 始 索 引 或 者 结束 索引 没有 被 指定 ， 则 分 别 以 字符 串 的 第 一 个 和 最 后 一 个 索引 值 为 默认 
值 。 


ss» asbtring[z:] 
! cd' 

>>> gstringll:] 
"DOG" 

PP» aüStringl:-1] 
"abc" 

»»» aString[:] 
'abcd' 


注意 : 起 始 /结束 索引 都 没有 指定 的 话 会 返回 整个 字符 串 。 
1. 成 员 操作 符 (in,not in) 


成 员 操 作 符 用 于 判断 一 个 字符 或 者 一 个 子囊 (中 的 字符 ) 是 否 出 现在 另 一 个 字符 串 中 。 出 现 
则 返回 True， 否 则 返回 False。 注意， 成 员 操作 符 不 是 用 来 判断 一 个 字符 串 是 否 包 含 另 一 个 字 
符 串 的 ， 这 样 的 功能 由 find() 或 者 index() (还 有 它们 的 兄弟 : rfind() 和 [rindex()) 函数 来 完成 。 


下 面 是 一 些 字 符 串 和 成 员 操作 符 的 例子 。 在 Python 2.3 以 前 ，in (和 not in) 操作 符 只 允许 用 
来 判断 一 个 单个 字符 是 否 属于 一 个 字符 串 ， 就 像 下 面 第 2 个 例子 那样 。2.3 以 后 这 个 限制 去 掉 
了 ， 所 有 的 字符 串 都 可 以 拿 来 判断 。 


20 “be” gn "abod' 
True 

pon "n' is 'abod" 
False 

>>> 'nm' not in 'abcd' 


True 
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在 例 6.1 里 面 ， 我 们 会 用 到 下 面 这 些 string 模 块 预定 义 的 字符 串 : 


>>> import string 

>>> string.uppercase 

' ABCDEFGHIJKLMNOPORSTUVWXYZ ' 

>>> string.lowercase 

'abcdefghijklmnopqrstuvwxyz' 

>>> string.letters 
'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ ' 
>>> string.digits 

'0123456789' 


例 6.1 是 一 个 用 来 检查 Python 有 效 标识 符 的 小 脚本 ， 名 字 是 idcheck.py。 我们 知道 ，Python 标 
识 符 必 须 以 字母 或 下 划 线 开头 ， 后 面 跟 字 母 、 下 划 线 或 者 数字 。 


例 6.1 标识 符 检查 (idcheck.py) 
标识 符合 法 性 检查 ， 首 先 要 以 字母 或 者 下 划 线 开始 ， 后 面 要 跟 字 母 ， 下 划 线 或 者 或 数字 。 这 
个 小 例子 只 检查 长 度 大 于 等 于 2 的 标识 符 。 


$'usr/bin/env python 


3 import string 


q | 


5 alphas = string.letters + 


b nums * string.digits 


8 print 'Welcome to the Identifier Checker v1.0*' 


9 print 'Testees must be at least 2 chars long." 


10 myInput = raw input('Identifier to test? ') 
11 
12 if len(myInput) » 1: 
13 
14 if myInput[0] not in alphas: 
15 print '''íinvalid: first symbol must be 
16 alphabetic''' 
7 else: 
18 for otherChar ín myInput[1:]: 
19 
20 if otherChar not in alphas * nums: 


print '''invalid: remaining 


22 symbols must be alphanumeric''' 
23 break 

24 else: 

25 print "okay as an identifier" 


这 个 例子 还 展示 了 字符 串 连 接 符 (4) 的 使 用 ， 本 章 的 后 面 会 讲 到 字符 串 连 接 符 。 运 行 几 次 后 
得 到 下 面 的 输出 : 
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$ python idcheck.py 


Welcome to the Identifier Checker v1.0 


Testees must be at least 2 chars long. 


Identifier to test? counter 

Okay as an identifier 

$ 

$ python idcheck.py 

Welcome to the Identifier Checker v1.0 
Testees must be at least 2 chars long. 
Identifier to test? 3d effects 


invalid: first symbol must be alphabetic 


让 我 们 逐 行 解释 这 个 应 用 程序 。 


3 ~ 6 行 


导入 string 模 块 并 且 预 定义 了 两 个 字符 串 ， 用 于 后 面 的 判断 。 


8 ~ 12 行 


输出 提示 信息 ， 第 12 行 的 语句 过 滤 掉 长 度 小 于 2 的 标识 符 或 者 候选 标识 符 。 


14 ~ 16 行 


检查 第 一 个 符号 是 不 是 字母 或 下 划 线 ， 如 果 不 是 ， 输 出 结果 并 退出 。 


17 ~ 18 行 


否则 ， 从 第 二 个 字符 开始 到 最 后 一 个 字符 ， 循 环 检查 剩余 的 字符 。 


20 ~ 23 行 


符 集合 的 。 只 要 发 现 一 个 非法 字符 ， 就 显示 结果 并 通过 break 语 句 退 出 。 


A C -u- Em]. > 4 | 
A? 6 平 A NJ DG P 3 2i A. 和 元 组 


检查 剩余 的 符号 是 否 都 是 字母 ， 下 划 线 或 者 数字 。 注 意 我 们 是 如 何 使 用 连接 操作 符 来 创建 合 
法 字 
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z :性 能 


一 般 来 说 ， 从 性 能 的 角度 来 考 上 处， 把 重复 操作 作为 参数 放 到 循环 里 面 进行 是 非常 低 效 的 . 
while i < len(myString): 
print 'character $d is:', myString[li] 

上 面 的 循环 操作 把 大 把 的 时 间 都 浪费 到 了 重复 计算 字符 囊 myString h KELT. kM 
环 选 代 都 要 运行 一 次 这 个 函 孝 。 如果 把 这 个 值 做 一 次 保存 ， 我 们 就 可 以 用 更 为 高 效 的 方 
式 重 写 我 们 的 循环 操作 . 

length = len(myString) 

while i « length: 


print 'character *d is:', myString[i] 


这 个 方法 同样 适用 于 上 面 的 例 6.1 
for otherChar in myInput[1:]: 


if otherChar not in alphas * nums: 


第 18 行 的 for 御 环 包含 了 一 个 证 语 自 ， 在 这 个 这 里 面 执行 了 合并 两 个 字符 囊 的 操作 。 被 
合并 的 这 两 个 字符 束 从 始 至 终 就 没 变 过 ， 而 每 次 都 会 重新 进行 一 次 计算 如 果 先 把 这 两 个 
字符 事 存 为 一 个 新 字符 串 ， 我 们 就 可 以 直接 引用 这 个 字符 串 而 不 用 进行 重复 计算 了 ， 
alphnums = alphas + nums 
for otherChar in myInput[1:]: 


if otherChar not in alphnums: 


24 ~ 2547 


或 许 现在 就 向 你 展示 for-else 循 环 语句 有 点 儿 早 ， 可 是 我 们 必须 先 看 一 看 这 个 语句 (在 第 8 章 有 
详细 的 介绍 ) 。for 循 环 的 else 语 句 是 一 个 可 选项 ， 它 只 在 for 循 环 完整 的 结束 ， 没 有 遇 到 break 
时 执行 。 在 我 们 的 例子 中 ， 如 果 所 有 的 符号 都 检查 合格 ， 那 么 我 们 就 得 到 了 一 个 合法 的 标识 
符 ， 程 序 会 返回 一 个 这 样 的 结果 ， 然 后 执行 完毕 。 


其 实 ， 这 段 程序 并 不 是 完美 的 ， 一 个 问题 就 是 标识 符 的 长 度 必 须 大 于 1。 我 们 的 程序 几乎 是 ， 

但 还 并 没有 站 正 定义 出 Python 标识 符 的 范围 ，Python 标 识 符 长 度 可 以 是 1。 另 一 个 问题 是 这 上 段 
程序 并 没有 考虑 到 Python 的 关键 字 ， 而 这 些 都 是 作为 保留 字 ， 不 允许 用 做 标识 符 的 。 我 们 把 

这 两 个 问题 作为 课 后 练习 留 给 读者 ( 见 练习 6-2) 。 

2. 连接 符 (+) 

运行 时 刻字 符 串 连接 

我 们 可 以 通过 连接 操作 符 来 从 原 有 字符 串 获 得 一 个 新 的 字符 串 。 我 们 已 经 在 前 面 的 例 6-1 里 面 
见识 过 连接 符 了 ， 下 面 是 一 些 更 多 的 例子 : 


'SpanishInquisition 
>>> 
>>> 'Spanish' + ' ' + 'Inquisition' 


'Spanish Inquisition' 


>>> 
>>> s = 'Spanish' + ' ' + 'Inquisition' + ' Made Easy' 
Ss» S 

'Spanish Inquisition Made Easy' 

>>> 

>>> import string 

>>> string.upper(s[:3] + s[20]) # archaic (see below) 
'" SPAM" 


最 后 一 个 例子 展示 了 用 一 个 字符 串 s 的 两 个 切片 来 构成 一 个 新 串 的 操作 ， 从 “Spanish" 里 面 切 
出 “Spa" 加 上 从 “Made"” 里 面 切 出 来 的 *M”。 将 抽取 出 来 字符 串 切 片 连接 后 作为 参数 传 给 了 
string.upper() 方 法 ， 该 方法 负责 把 字符 串 的 所 有 字符 都 变 为 大 写 。String 模 块 的 方法 是 在 
Pythonl.6 里 面 添加 进来 的 ， 所 以 这 个 操作 也 可 以 用 最 后 一 个 字符 串 的 一 个 单一 方法 调用 来 完 
成 ( 见 下 面 的 例子 ) 。 现 在 已 经 没有 必要 导入 string 模 块 了 ， 除 非 你 需要 访问 该 模块 自己 定义 
的 字符 囊 常量 。 注 意 : 虽然 对 初学 者 来 说 string 模 块 的 方式 更 便于 理解 ， 但 出 于 性 能 方面 的 考 
虑 ， 我 们 还 是 建议 你 不 要 用 string 模 块 。 原 因 是 Python 必须 为 每 一 个 参加 连接 操作 的 字符 串 分 
配 新 的 内 存 ， 包 括 新 产生 的 字符 串 。 取 而 代 之 ， 我 们 推荐 你 像 下 面 介绍 的 那样 使 用 字符 串 格 
式 化 操作 符 〈%) ， 或 者 把 所 有 的 字符 串 放 到 一 个 列表 中 去 ， 然 后 用 一 个 join() 方 法 来 把 它们 
连接 在 一 起 。 


>>> '&s $s' 3% ('Spanish', 'Inquisition') 


'Spanish Inquisition' 


>> 
>>> s = '' '.,join(('Spanish', 'Inquisition', 'Made Easy')) 
2522 S 


'Spanish Inquisition Made Easy' 


>>> # no need to import string to use string.upper(): 


>>> ('&s$s' (s[:3], s[20])).upper() 


3. 编译 时 字符 串 连 接 


上 面 的 语法 在 运行 时 字符 串 连 接 的 加 法 操作 ， 这 个 用 法 是 非常 标准 的 。Python 中 还 有 一 种 并 
不 是 经 常用 到 ， 更 像 是 一 种 程序 员 的 习惯 用 法 的 语法 。Python 的 语法 允许 你 在 源码 中 把 几 个 
字符 串 连 在 一 起 写 ， 以 此 来 构建 新 字符 串 。 


一 pg 


Python 核心 编程 第 二 版 


SS TOO = "Hello" 'worldl!' 
>>> Too 
'Helloworld!' 


通过 这 种 方法 ， 你 可 以 把 长 的 字符 串 分 成 几 部 分 来 写 ， 而 不 用 加 反 斜 本 。 如 上 所 示 ， 你 可 以 


在 一 行 里 面 混用 两 种 分 号 。 这 种 写法 的 好 处 是 你 可 以 把 注释 也 加 进来 ， 如 下 所 示 。 


>>> f = urllib.urlopen('http://' # protocol 


'localhost' # hostname 
':8000' * port 
'/cgi-bin/friends2.py') # file 


Ae 4 PE 28.» F das. X urlopen() 2 EME 8 A Sc pA e 


>>> 'http://' 'localhost' ':8000' '/cgi-bin/friends2.py' 
'http://localhost:8000/cgi-bin/friends2.py' 


4. 普通 字符 串 转化 为 Unicode 字 符 串 


如 果 把 一 个 普通 字符 串 和 一 个 Unicode 字 符 串 做 连接 处 理 ，Python 会 在 连接 操作 前 先 把 普通 字 


符 串 转化 为 Unicode 字 符 囊 : 
> 'Hello' + mut T 4 'World' + yrn 
u'Hello World!' 
重复 操作 符 ( * ) 


重复 操作 符 创建 一 个 包含 了 原 有 字符 囊 的 多 个 拷贝 的 新 囊 。 


E eL Em: ——4S Zi E ía 4 2n 
^ 6x FEN: FR FoI RIA 
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2S» UNIYT* *73 
'"Ni!'Ni!Ni!' 
>>> 


>>> '*'*40Q) 


Ve che e oe oe oe oe eoe oe eee oe de oe oe de oe eee e oe eoe eoe oe oe e ce cec eec o! 


>>> 
>>> print '-' * 20, 'Hello World!', '-' * 20 

rumen rtm mt p qu m iita cs Hello World! -------------------- 
>>> who = 'knights' 


>>> who * 2 
'knightsknights' 
>>> who 


'"knights' 


像 其 他 的 标准 操作 符 一 样 ， 原 变量 是 不 被 修改 的 ， 就 像 上 面 最 后 一 个 例子 所 示 。 


64 只 适用 于 字符 串 的 操作 符 


6.4.1 格式 化 操作 符 (99) 


Python 风格 的 字符 串 格式 化 操作 符 。 只 适用 于 字符 串 类 型 ， 非 常 类 似 于 C 语 言 里 面 的 printf() 也 
数 的 字符 串 格式 化 ， 甚 至 所 用 的 符号 都 一 样 ， 都 用 百 分 号 〈%) ， 并 且 支 持 所 有 printf() 式 的 格 
式 化 操作 。 语 法 如 下 。 

左边 的 format_string 里 面 同 通常 会 在 printf() 函 数 的 第 一 个 参数 里 面 见 到 的 一 样 ， 包 含 % 的 格式 


化 字符 串 。 表 6.4 列 出 了 可 用 的 各 种 符号 。arguments_to_convert 参 数 是 你 要 转化 、 显 示 的 变 
量 ， 对 应 于 你 送 给 prinf() 的 其 他 参数 。 


o x 
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格式 化 字符 


二 版 


字符 串 格式 化 符号 
转换 方式 

转换 成 字符 〈ASCII 码 值 ， 或 者 长 度 为 一 的 字符 束 ) 
优先 用 repeOi hat trm m m 
优先 用 seh tig tog m mme 
转 成 有 符号 十 进 制 数 
转 成 无 符号 十 进 制 数 
转 成 无 符号 八进制 数 
HREH ANEAN (OX 代表 转换 后 的 十 六 进 制 学 符 的 大 小 写 ) 
转 成 科学 计数 法 〈wE 控制 给 出 wE) 
转 成 浮 点 型 《小 歼 部 分 自然 截断 ) 
%e RIKOE 和 %F 的 简写 
L DIET 





a. Python20 Fit: 而 且 好 像 只 有 Python Witi. 
b. Python2.4 用 而 Mw Wo/ Ww36X (E34 trinatit zoe] 7 fi rmm. 


Python 支持 两 种 格式 的 输入 参数 。 第 一 种 是 元 组 (12.8 6$ > 6.157) ， 这 基本 上 是 一 种 的 C 

printf() 风 格 的 转换 参数 集 ; Python 支持 的 第 二 种 形式 是 字典 形式 〈 详 见 第 七 章 ) 字典 其 实 是 

一 个 哈 希 键 - 值 对 的 集合 。 这 种 形式 里 面 ， 键 是 作为 格式 字符 串 出 现 ， 相 对 应 的 值 作为 参数 在 

进行 转化 时 提供 给 格式 字符 囊 . 格式 字符 串 既 可 以 跟 print 语 句 一 起 用 来 向 终端 用 户 输 出 数 

据 ， 又 可 以 用 来 合并 字符 串 形 成 新 字符 串 ， 而 且 还 可 以 直接 显示 到 GUI 界面 上 去 。 其 他 的 格式 


字符 和 方法 见 表 6.5 。 


m 6.5 


格式 化 操作 符 辅助 指令 
"on 

定义 宽度 或 者 小 数 点 精度 
用 做 左 对 齐 
(EN nS CO 
(t iR acr 
在 八进制 数 前 而 显示 零 《0 》， 在 十 六 进 制 前 而 显示 Ox 成 者 0X 《取决 对 用 的 是 x 还 是 X") 
显示 的 数字 前 曾 填 充 '0' 击 不 是 默认 的 空格 
%% 和 输出 一 个 单一 的 3% 
映射 变量 (学 典 参数 ) 
m 是 显示 的 最 小 总 宽度 ，n 是 小 数 点 后 的 位 数 〔 如 赣 可 用 的 话 》 


以 下 是 一 些 使 用 格式 字符 串 的 例子 。 


1. 十 六 进 制 输出 


POF BA: 
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090 US" % 1068 
'"6ec' 


22» 


»»» "5x" % 108 
' 6C" 

55» 

>>> "&sX"'€*& 108 
'OX6C' 

s99 

25» "S$ix" *$ 108 
"sco" 


2.， 浮 点 型 和 科学 记 数 法 形式 输出 


第 
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»»» 
>>> 'S$f' $ 1234.567890 
'1234.567890' 


>>> 
>>> '$.2f' $ 1234.567890 
"1234,57" 

>>> 

>>> '$E' $ 1234.567890 
'1.234568E+03' 

>>> 

>>> '$e' $ 1234.567890 
'1.234568e+03' 

>>> 

>>> 't$g' $ 1234.567890 
Tio? 

>>> 

>>> '$G' $ 1234.567890 
"1234.57"* 

>>> 

2»» "Sc" & (11111111111111111111112) 
"1.11111les21" 


3. 整 型 和 字符 串 输 出 
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>>> "54d" $ 4 

FVU 

>>> 

>>> "$4d" $ -4 

24" 

»»» 

>>> "we are at $d$$" $ 100 

'we are at 100$' 

>>> 

>>> 'Your host is: $s' $ 'earth' 
'Your host is: earth' 

>>> 

>>> "Höst: $sNtPort: $d' $ ('mars', 80) 
'Host: mars Port: 80' 

»»» 


>>> num = 123 


>>> 'dec: $d/oct: %#o/hex: $4X' $ (num, num, num) 
'dec: 123/oct: 0173/hex: OX7B' 

>>> 

>>> "MM/DD/YY = $02d/$02d/*d" $ (2, 15, 67) 
'MM/DD/YY - 02/15/67' 

>>> 

>>> w, p = 'Web', 'page' 

>>> 'http://xxx.yyy.zzz/$*s/$*s.html' % (w, p) 
'http://xxx.yyy.zzz/Web/page.html' 


上 面 的 例子 都 是 使 用 的 元 组 类 型 的 参数 作 转 换 。 下 面 我 们 将 把 字典 类 型 的 参数 提供 给 格式 化 
操作 符 。 


>>> 'There are $(howmany)d $(lang)s Quotation Symbols' $ \ 
2... ('lang': 'Python', 'howmany': 3) 
'There are 3 Python Quotation Symbols' 
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4. 令 人 称奇 的 调试 工具 


字符 串 格式 化 操作 符 不 仅 很 酷 、 易 用 、 上 手 快 ， 而 且 是 一 个 非常 有 用 的 调试 工具 。 事 实 上 ， 
所 有 的 Python 对 象 都 有 一 个 字符 串 表 示 形 式 〈 通 过 repr() 函 数 ， 或 tr() 函 数 来 展现 ) 。print 语 句 
自动 为 每 个 对 象 调 用 str() 函 数 。 更 好 的 是 ， 在 定义 自己 的 对 象 时 ， 你 可 以 利用 "钩子 " 为 你 的 对 
象 创 建 字 符 串 表达 形式 。 这 样 ，repr()，str() 或 者 print 被 调用 时 ， 就 可 以 获得 一 个 适当 的 字符 
串 描 述 信 息 。 即 使 在 坏 得 不 能 再 坏 的 情况 下 ，repr() 或 者 str() 也 不 能 显示 一 个 对 象 的 信息 


时 ，“Pythonic” 的 默认 做 法 最 起 码 能 给 你 返回 如 下 格式 的 信息 。 


«... Something that is useful ...». 


6.4.2 字符 串 模 板 : 更 简单 的 替代 品 


字符 串 格式 化 操作 符 是 Python 里 面 处 理 这 类 问题 的 主要 了 手段， 而 且 以 后 也 是 如 此 。 然 而 它 也 
不 是 完美 的 ， 其 中 的 一 个 缺点 是 它 不 是 那么 直观 ， 尤 其 对 刚 从 C/C++ 转 过 来 的 Python 新 手 来 
说 更 是 如 此 ， 即 使 是 现在 使 用 字典 形式 转换 的 程序 员 也 会 偶尔 出 现 遗 漏 转换 类 型 符号 的 错 
误 。 比 如 说 ， 用 了 % (lang) 而 不 是 正确 的 % (lang) s。 为 了 保证 字符 串 被 正确 的 转换 ， 程 
序 员 必 须 明确 的 记 住 转 换 类 型 参数 ， 比 如 到 底 是 要 转 成 字符 串 、 整 型 还 是 其 他 什么 类 型 。 


新 式 的 字符 串 模 板 的 优势 是 不 用 去 记 住所 有 的 相关 细节 的 ， 而 是 像 现 在 shell 风 格 的 脚本 语言 
里 面 那样 使 用 美元 符号 ($) 。 


由 于 新 式 的 字符 串 Template 对 象 的 引进 使 得 string 模 块 又 重新 活 了 过 来 ，Template 对 象 有 两 个 
方法 ，substitute() 和 safe_substitute()。 前 者 更 为 严 说， 在 key 缺 少 的 情况 下 它 会 报 一 个 
KeyError 的 异常 出 来 ， 而 后 者 在 缺少 Key 时， 直接 原封 不 动 的 把 字符 串 显 示 出 来 。 


^ from string import Templat« 
ren " ( I wman i Y ) 
" print s.substitute(lange'Python', howmany*3) 
ire 3 Pyt iQ à 
print 1j 
3ceDack ost t l 1 ) 
ED din 
/ yt 1 tri l I t 1 
return self.pattern.sub(t nvert, se ‚template 
Í 7" /1 1 yt l tr J ] l r 
mapr 
ey wW 
>>> 


>>> print s.safe substitute(lang-'Python') 


There are $S(howmany) Python Quotation Symbols 


新 式 的 字符 串 模板 是 从 Python2.4 开 始 加 入 的 ， 更 多 信息 请 查阅 《Python 类 库 参 考 手 册 》 
(Python Library Reference Manual) 和 PEP 292 » 
6.4.3 原始 字符 串 操 作 符 (r/R) 


关于 原始 字符 串 的 目的 ， 在 Pythonl.5 里 面 已 经 有 说 明 ， 是 为 了 对 付 那些 在 字符 串 中 出 现 的 特 
丈 字符 (下 面 的 小 节 会 介绍 这 些 特殊 字符 ) 。 在 原始 字符 串 里 ， 所 有 的 字符 都 是 直接 按照 字 
面 的 意思 来 使 用 ， 没 有 转 义 特殊 或 不 能 打印 的 字符 。 


原始 字符 串 的 这 个 特性 让 一 些 工作 变 得 非常 的 方便 ， 比 如 正则 表达 式 的 创建 〈 详 见 文档 的 re 模 
Jk) 。 正 则 表达 式 是 一 些 定义 了 高 级 搜索 匹配 方式 的 字符 串 ， 通 常 是 由 代表 字符 、 分 组 、 匹 
配 信息 、 变 量 名 和 字符 类 等 的 特殊 符号 组 成 。 正 则 表达 式 模块 已 经 包含 了 足够 用 的 符号 。 但 
当 你 必须 插入 额外 的 符号 来 使 特殊 字符 表现 的 像 普通 字符 的 时 候 ， 你 就 陷入 了 “字符 数字 ”的 泥 
泽 ! 这 时 原始 字符 串 就 会 派 上 用 场 了 。 
除了 原始 字符 串 符 号 (引号 前 面 的 字母 "P") 以 外 ， 原 始 字符 串 跟 普通 字符 串 有 着 几乎 完全 相 
同 的 语法 。 这 个 中 可 以 是 小 写 也 可 以 是 大 写 ， 唯 一 的 要 求 是 必须 紧 千 在 第 一 个 引号 前 。 在 3 个 
例子 的 第 1 个 例子 里 面 ， 我 们 需要 一 个 反 斜 杠 加 一 个 "n? 来 而 不 是 一 个 换行 符 。 

o» FAm! 

tipa 


0» orint !\p? 
$50. p'Xs' 

EA 

ND prine r'Xn' 
An 


接 下 来 的 例子 里 ， 我 们 打 不 开 我 们 的 README 文 件 了 ， 为 什么 ? 因为 Ab 和 %r' 被 当成 不 在 我 们 
的 文件 名 中 的 特殊 符号 ， 但 它们 实际 上 是 文件 路 径 中 的 4 个 独立 的 字符 。 


>>> f = open('C:NwindowsNtempNreadme.txt', 'r') 


Traceback (most recent call last): 


pen( windo mpNreadme.txt', 'r 
IOError: [Errno 2] No su file or directory wir ws\\temp\readme .txt 
> f pen (r'C:\window mp idm x y 
>>> f.readline() 
'Table of C e (please eck timestamps C-A update!) An 


>>> f.close() 
最 后 我 们 要 找 一 对 原始 的 \n 字 符 而 不 是 换行 。 为 了 找到 它 ， 我 们 使 用 了 一 个 简单 的 正则 表达 
式 ， 它 的 作用 是 查找 通常 被 用 来 表示 空白 字符 的 反 针 线 - 字 符 对 (backslash-character 
pairs) 。 

>>> import re 


>>> m = re.search('NNWM[rtfvn]', r'Hello World!Mn') 


>>> if m is not None: m.group() 


>>> m = re.search(r'WMWM[rtfvn]', r'Hello World!Mn') 


>>> if m is not None: m.group() 


"Xn , 


6.4. Unicode 字 符 串 操作 符 (ulU) 


Unocide 字 符 串 操作 符 ， 大 写 的 (U) 和 小 号 的 (u) 是 在 Pythonl.6 中 和 Unicode 字 符 串 一 起 被 
引入 的 ， 它 用 来 把 标准 字符 囊 或 者 是 包含 Unicode 字 符 的 字符 囊 转 换 成 完全 的 Unicode 字 符 串 
对 象 。 关 于 Unicode 字 符 串 的 进一步 信息 在 6.7.4 节 有 详细 介绍 。 另 外 ， 字 符 串 方法 〈 见 6.6 

节 ) 和 正则 表达 式 引 敬 也 支持 Unicode。 下 面 是 几 个 例子 。 


u'abc' U*0061 U*0062 U*0063 
u'Nu1234' U*1234 
u'abcNu1234Mn' U-0061 U+0062 U*0063 U*1234 U*0012 


Unicode 操 作 符 也 可 以 接受 原始 Unicode 字 符 串 ， 只 要 我 们 将 Unicode 操 作 符 和 前 面 讨 论 过 的 
原始 字符 串 操 作 符 连接 在 一 起 就 可 以 了 。 注 意 ，Unicode 操 作 符 必 须 出 现在 原始 字符 串 操 作 符 
前 面 。 


ur'Helloö\nworla!' 


6.5 内 建 函数 


6.5.4 标准 类 型 函数 


cmp() 
同比 较 操 作 符 一 样 ， 内 建 的 cmp() 函 数 也 根据 字符 串 的 ASCII 码 值 进 行 比 较 。 


>>> EL "ABO 
po arra = "mM 
noo str3 = “wya 


255 cmp(strl, SEZ) 


Do OSEE; SEEL) 


»5»» cmpistrz, 'lmn') 


一 
一 

oO 

= 


»»» strl = 'abc' 
>>> len(strl) 
3 


>>> len('Hello World!') 
12 


正如 你 期 望 的 那样 ， 内 建 函 数 len() 返 回 字符 囊 的 字符 数 。 


max( and min() 


>>> sStpy2 = mn" 


o» str3 = 'xyz" 


>>> maxistr2z) 
a 
>>> Min (str3) 


Tsp 


虽然 max() 和 min() 函 数 对 其 他 的 序列 类 型 可 能 更 有 用 ， 但 对 于 string 类 型 它们 能 很 好 地 运行 ， 
返回 最 大 或 者 最 小 的 字符 〈 按 照 ASCII 码 值 排列 ) ， 下 面 是 几 个 例子 。 
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25» mini'ablzcod') 
JR 

>>> min('ABl12CD') 
17 3 

>>> min('ABabCDcd'!') 
"A" 


enumerate() 


>>> s = 'foobar' 


>>> for i, t in enumerate(s): 


es. print 1, £ 


c4 0 t HM o 
H P DG OQ O th 


zip() 


E 
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S52» 8, t w"fTos', "'obr"' 
>>> zi1p(s, t) 
LE "9^9. To AUOD, eae 1*3] 


6.5.3 ”字符 串 类 型 函数 
raw input() 


内 建 的 raw_input() 函 数 使 用 给 定 字符 串 提 示 用 户 输入 并 将 这 个 输入 返回 ， 下 面 是 一 个 使 用 
raw_input() 的 例子 。 


>>> user_input = raw_input ("Enter your name: ") 
Enter your name: John Doe 
>>> 


>>> user input 
'John Doe' 
>>> 


>>> len(user input) 

8 
Python 里 面 没 有 C 风 格 的 结束 字符 NUL， 你 输入 多 少 个 字符 ，len() 函 数 的 返回 值 就 是 多 少 。 
str() and unicode() 
str() 和 unicode() 有 函数 都 是 工厂 函数 ， 就 是 说 产生 所 对 应 的 类 型 的 对 象 。 它 们 接受 一 个 任意 类 
型 的 对 象 ， 然 后 创建 该 对 象 的 可 打印 的 或 者 Unicode 的 字符 串 表 示 。 它 们 和 basestring 都 可 以 
作为 参数 传 给 isinstance() 函 数 来 判断 一 个 对 象 的 类 型 。 

>>> isinstance(u'WMOxAB', str) 

False 

>>> not isinstance('foo', unicode) 

True 

>>> isinstance(u'', basestring) 

True 

>>> not isinstance('foo', basestring) 


False 


chr() ` unichr()feord() 


chr() &4& f] —4- 6 BL Arange (256) 内 的 (就 是 0~255) 整数 作 参 数 ， 返 回 一 个 对 应 的 字 

符 。unichr() 跟 它 一 样 ， 只 不 过 返回 的 是 Unicode 字 符 ， 这 个 从 Python 2.0 才 加 入 的 unichr() 的 
参数 范围 依赖 于 你 的 Python 是 如 何 被 编译 的 。 如 果 是 配置 为 USC2 的 Unicode， 那 么 它 的 允许 
范围 就 是 range (65536) 或 OxOOOO-OxFFFF ; 如 果 配 置 为 UCS4， 那 么 这 个 值 应 该 是 
range (1114112) 或 0X000000-0x110000。 如 果 提 供 的 参数 不 在 允许 的 范围 内 ， 则 会 报 一 个 
ValueError 的 异常 。 


ord() 函 数 是 chr() 函 数 〈 对 于 8 位 的 ASCII 字 符 串 ) Sunichr()i&Z& (对 于 Unicode 对 象 ) 的 配对 
函数 ， 它 以 一 个 字符 〈 长 度 为 1 的 字符 串 ) 作为 参数 ， 返 回 对 应 的 ASCII 数 值 ， 或 者 Unicode 数 
值 ， 如 果 所 给 的 Unicode 字 符 超出 了 你 的 Python 定义 范围 ， 则 会 引发 一 个 TypeError 的 异常 。 


6.6 A FARA 


字符 串 方 法 是 从 Pythonl.6 到 2.0 慢 慢 加 进来 的 它们 也 被 加 到 了 Jython 中 。 这 些 方法 实现 了 
string 模 块 中 的 大 部 分 方法 ， 表 6.6 列 出 了 目前 字符 串 内 建 支持 的 方法 ， 所 有 这 些 方 法 都 包含 了 
对 Unicode 的 支持 ， 有 一 些 甚至 是 专门 用 于 Unicode 的 。 
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字符 串 类 型 内 建 方法 
a" ox 
EPERERA 
ARI — RCEREBAC D, SREE width NEED 
AI var 在 string UN HA C den AR beg 或 者 cod 指定 期 名 加 指定 范围 上 str 出 现 的 次 数 
UL dncoding fi fH PH AUR EJ string. 6008 HE MIU — ^ ValueError HPR, Re f eros 
Tie f) ignore HB replace 


VÀ encoding 1t EUM OCUSUT siring, MEGARA 
ValucError MIR, REIN errors Zt E (f) JU ignore WT "replace" 


检查 学 符 间 是 吾 以 ohj AC. (m eg HERE end Tie pilo fime ed IN A EE UE obj fuk. 


TUTO 1 sring 中 的 bb 099 Arv. REA EAER tibwize 是 


WEM su DIAE string 中 ， 如 果 beg 和 end GE RUM, MOTEUR TERGERNMW. 
LES ICULTT DI MEI 


Wi find(y/ji4.—WE.— FORSE 08 str 不 在 string "PHI 


R string 3H 1835091 TURTCETHBAUT S LRCERUR IM True, TERRE False 
10 46 string BO 4 — 177 9ERURRCTSIEUETEERGR EI True, WAER False 

55 E string JUS A HERCULI True, f RD False 

和 如果 string SS ARCER Trie TRGE False 


各 类 string HERED -ARAA DEPRE. PRANE (区 分 大 小 党 的 ) TERIEUE A 
Ej. MEE Trece. PEROISI False 


如 果 string PRUAN. MEE Troc. EON EE False 
fe string 中 只 亿 丰 空格 ， 划 巡回 True, TEANGA] False 
RW ring 是 入 是 化 的 【所 ilei) BRE Trae, WNEI Faise 


Arr string PUREO -ARRERA REFUSES CICRREKC PED HR IUE 
*;, MR True. TREF False 


VÀ string 作为 分 限 符 ， 将 seq PERERA GS Emm 
3I RCETHRAOH AR. ENAERE width 的 新 学 罕 市 

MB wiring AEN AIFA 

AKI string 左边 的 空 党 


HAR find 古 ihl0) 的 结合 体 ， 从 二 出 现 的 第 一 个 位 置 起 ， 半 字符 市 string 分 成 一 个 3 元 
fü Caring pre strotrstring post str) ,— 109 string PALLA ste IM string. pee. str =— string 


起 string 中 的 strl MORIA se2, R num Hz. AFA mum 次 
RAF fied o. RUERUA GUERRE 
RUF index) PERAGA 


AREL—THRCINHRZUONTE. ENERE width MRAR N 
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Er. 

为 ”法 m a 
string rpartition(str)* RMF parion B. TAAR 
string rstrip() BILE string 字符 玉米 尾 的 空格 
string split(str-"", num 以 str 为 分 隔 符 切片 sring， 如 果 num AIEN, WERE num 
"string. count(str)) ^frnb 
string splitlines(mum- 按照 行 分 隔 ， 返 回 一 个 包含 各 行 作为 元 素 的 列表 ， 如 果 num 指 
string count("a))"* 定 则 仅 切片 num f; 
string startswith(obj, beg 检查 字符 中 是 否 是 以 obj Fa WAGE Tre, FREE False 
79,end-len(string)) * 如 果 beg 和 end ARAN, Pie RUIN PL f 
string stripi[obj]) 在 string. 上 执行 lstripD 和 rstrip() 
string swapcase() BIS string 中 的 大 小 写 
string title)" * 返回 “标题 化 ”的 string. LIE ULUREHICA AUBAE CUM. JC! RS DTE CR istitle) 
string translate(str, dels"") 根据 str Hte Cc 256 个 字符 》 转 换 string NP, WIERNA del 参数 中 
string uppert) 转换 string 中 的 小 写字 但 为 大 写 
string zfill(width) BKA width HREM, EEN string 右 对 齐 ， 前 面 填充 0 


a. Pythonl.ó 中 内 适用 于 Unicode Fh. 2.0 中 适用 于 所 有 学 符 事 。 
b. 1.52 版 本 中 string 模 埃 没 有 该 方法 。 

€. TE Jython2.1 新 加 入 ， 

d. A Unicode FAMA. 

€. Python2.5 RAEE. 


下 面 是 几 个 使 用 字符 串 方 法 的 例子 。 
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>>> quest = 'what is your favorite color?' 
>>> quest.capitalize() 

'What is your favorite color?' 

>>> 

>>> quest.center(40) 

: what is your favorite color? ' 


>>> quest.count('or') 


>>> quest.endswith('blue') 
False 

>>> 

>>> quest.endswith('color?') 
True 

>>> 

>>> quest.find('or', 30) 
= 

>>> 

>>> quest.find('or', 22) 
25 

>> 

>>> quest.index('or', 10) 
16 


>>> 

>>> ':'.join(quest.split()) 
'what:is:your:favorite:color?' 

>>> quest.replace('favorite color', 'quest') 
>>> 

'what is your quest?' 

>>> 

>>> quest.upper() 

'WHAT IS YOUR FAVORITE COLOR?' 
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LERA de) X split()fejoin() £& Zx 49 9B 4- EARTE strin tA A split() & Zc * AA A 
参数 ， 也 就 是 说 以 空格 作为 分 隔 符 分 隔 字 符 串 ， 然 后 我 们 以 这 个 包含 单词 的 列表 做 参数 调用 
join() 方 法 把 这 些 单 词 用 一 个 新 的 分 隔 符 冒 号 重新 串 在 一 起 。 注 意 。 我 们 首先 用 split() 函 数 把 

string 切 片 成 一 个 列表 ， 然 后 我 们 在 字符 囊 上 应 用 join() 方 法 把 这 个 列表 重新 连接 成 一 个 字符 
$ o 


6.7 字符 串 的 独特 特性 


6.7.1 特殊 字符 串 和 控制 字符 


像 其 他 高 级 语言 和 脚本 语言 一 样 ， 一 个 反 斜 线 加 一 个 单一 字符 可 以 表示 一 个 特殊 字符 ， 通 常 
是 一 个 不 可 打印 的 字符 ， 这 就 是 我 们 上 面 讨论 的 特殊 字符 ， 如 果 这 些 特殊 字符 是 包含 在 一 个 
原始 字符 串 中 的 ， 那 么 它 就 失去 了 转 义 的 功能 。 


除了 通常 用 的 特殊 字符 ， 比 如 换行 符 (Wn) ,tab 符 〈\t) 之 外 ， 也 可 以 直接 用 ASCII 码 值 来 标示 
特殊 字符 : \000 或 者 XXX， 分 别 对 应 字符 的 八进制 和 十 六 进 制 ASCII 码 值 ， 下 面 分 别 是 十 进 
制 、 八 进 制 和 十 六 进 制 的 065 和 255 » 


ASCII ASCII ASCII 
Decimal 0 65 299 
Octal \000 X101 3473 
Hexadecimal x00 \x41 \xFF 


AERSRAE ^ 6LA& EHRL de SL AIAR EAR T VL E38 F 4E € 4 SI Python? F4 9 P e 


跟 C 字 符 串 的 另 一 个 不 同 之 处 是 Python 的 字符 串 并 不 是 以 NUL (000). 作为 结束 符 的 。 NULSR 
其 他 的 反 儿 杠 转 义 字符 没什么 两 样 。 事 实 上 ， 一 个 字符 串 中 不 仅 可 以 出 现 NUL 字 符 ， 而 且 还 
可 以 出 现 不 止 一 次 ， 在 字符 串 的 任意 位 置 都 可 以 。 表 6.7 列 出 了 被 大 部 分 Python 版 本 支持 的 转 
义 字 符 。 

如 上 所 述 ， 就 像 使 用 连 字符 来 让 一 行 的 内 容 持续 到 下 一 行 一 样 ， 可 以 用 显 式 定义 八进制 或 者 
十 六 进 制 的 ASCII 码 的 方式 定义 特殊 字符 ， 合 法 的 ASCII 码 值 范围 是 0~255 (八进制 的 是 
0177， 十 六 进 制 是 0XFF) ° 











` cA 
&67 反 斜 杠 开头 的 转 义 字符 
" 4 | j w | i 1 n g uj 
+ 4 4 
D 000 I ü 0x00 NUI d r% Nul 
$ 
007 7 0x07 BEI 响 铃 学 符 
b 010 8 0x08 BS in 
- 4 + j! 2 
: 011 9 0x09 HT 横向 制 表 符 
一 4 - i + 4 
n 012 10 Ox0A LF 换行 
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X000 和信 进 制 值 (3558 000-0177) 

WXX x 打头 的 十 六 进 制 值 (范围 是 0x00 到 0xFF) 

\ 连 字 符 ， 将 本 行 和 下 一 行 的 内 容 连 接 起 来 。 

控制 字符 的 一 个 作用 是 用 做 字符 串 里 面 的 定 界 符 ， 在 数据 库 或 者 Web 应 用 中 ， 大 多 数 的 可 打 
印字 符 都 是 被 允许 用 在 数据 项 里 面 的， 就 是 说 可 打印 的 字符 不 适合 做 定 界 符 。 

用 可 打印 的 字符 串 比 如 冒号 (:) 来 作 定 界 符 ， 将 会 很 难 分辨 一 个 字符 到 底 是 数据 还 是 定 界 
符 。 而 且 还 会 限定 你 能 用 在 数据 项 里 面 的 字符 数量 ， 而 这 不 是 你 想 要 的 。 

一 个 通常 的 解决 方案 是 ， 使 用 那些 不 经 常 使 用 的 ， 不 可 打印 的 ASCII 码 值 来 作为 定 界 符 ， 它 们 
是 非常 完美 的 定 界 符 ， 这 样 一 来 诸如 冒号 这 样 的 可 打印 字符 就 可 以 解脱 出 来 用 在 数据 项 中 

T o 


6.7.2 三 引号 


虽然 你 可 以 用 单 引号 或 者 双 引号 来 定义 字符 串 ， 但 是 如 果 你 需要 包含 诸如 换行 符 这 样 的 特殊 
字符 时 ， 单 引号 或 者 双 引 号 就 不 是 那么 方便 了 。Python 的 三 引号 就 是 为 了 解决 这 个 问题 的 ， 
它 允许 一 个 字符 串 路 多 行 ， 字 符 囊 中 可 以 包含 换行 符 、 制 表 符 以 及 其 他 特殊 字符 。 


三 引号 的 语法 是 一 对 连续 的 单 引 号 或 者 双 引 号 (通常 都 是 成 对 的 用 ) 。 
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Po BE = TE 
there''' 
»»» hi # repr() 
'hiNnthere' 
>>> print hi * stri) 
hi 
there 
三 引号 让 程序 员 从 引号 和 特殊 字符 串 的 泥潭 里 面 解脱 出 来 ， 自 始 至 终 保持 一 小 块 字符 串 的 格 


式 是 所 谓 的 NYSIWYG (所 见 即 所 得 ) 格式 的 。 
一 个 典型 的 用 例 是 ， 当 你 需要 一 块 HTML 或 者 SQL 时 ， 这 时 用 字符 囊 组 合 ， 特 殊 字 符 囊 转 义 将 
RIER AIRA o 
errHTML = ''' 
<HTML><HEAD><TITLE> 
Friends CGI Demo</TITLE></HEAD> 
<BODY><H3>ERROR</H3> 
XB»$s«/B»«P» 
<FORM><INPUT TYPE-button VALUE-Back 
ONCLICK-"window.history.back()"»«/FORM» 
«/BODY»«/HTML» 
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cursor.execute( 
CREATE TABLE users ( 
login VARCHAR(8), 
uid INTEGER, 
prid INTEGER) 

n) 


6.7.3 字符 串 不 变性 


在 第 4.7.2 节 里 面 ， 我 们 讨论 了 字符 串 是 一 种 不 可 变数 据 类 型 ， 就 是 说 它 的 值 是 不 能 被 改变 或 
修改 的 。 这 就 意味 着 如 果 你 想 修改 一 个 字符 串 ， 或 者 截取 一 个 子囊 ， 或 者 在 字符 串 的 末尾 连 
接 另 一 个 字符 串 等 ， 你 必须 新 建 一 个 字符 串 。 


这 听 起 来 要 比 实际 情况 复杂 。 因 为 Python 替 你 管理 内 存 ， 你 根本 不 需要 知道 到 底 发 生 了 什 
么 ， 每 次 你 修改 一 个 字符 串 或 者 做 一 些 改变 字符 串 内 容 的 操作 时 ，Python 都 会 自动 为 你 分 配 
一 个 新 囊 。 在 下 面 的 例子 里 面 ，Python 分 别 为 “abc”" 和 “def' 分 配 了 空间 ， 当 进行 连接 操作 时 ， 
Python 自 动 为 新 的 字符 囊 “abcdef" 分 配 了 空间 。 


>>> 'abc' + 'def' 
'abcdef' 


>>> S = 'abc' 


>>> S = S + 'def' 
>>> 8 
'abcdef' 


上 面 的 例子 里 ， 看 起 来 是 我 们 先 把 abc 赋 给 了 s， 然 后 在 S 的 末尾 添加 了 "def'。 这 样 看 起 来 字符 
串 似乎 是 可 变 的 ， 其 实事 实 是 在 "s+'def”" 这 个 操作 进行 的 时 候 ， 新 建 了 一 个 新 字符 串 ， 然 后 这 
个 新 的 对 象 被 赋 给 了 Ss， 原 来 的 字符 串 '‘abc' 被 释放 掉 了 。 

我 们 可 以 用 id() 函 数 来 更 明显 的 显示 出 来 到 底 发 生 了 什么 复习 一 下 ，id() 函 数 返 回 一 个 对 象 的 身 
份 ， 这 个 概念 有 点 类 似 于 “内 存 地 址 ”。 


>> s = 'abc' 
>>> 

»oo idi[s5) 
135060856 

25» 

>>> s += 'def' 
>>> l1dí(s) 
135057968 


注意 修改 前 后 的 身份 是 不 同 的 。 另 一 个 测试 是 针对 字符 串 的 一 个 字符 或 者 一 个 子囊 所 做 的 修 
改 。 我 们 现在 将 展示 对 字符 串 的 一 个 字符 或 者 一 片 字符 的 改动 都 是 不 被 允许 的 。 
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> > 8 

'abcdef' 

>>> 

Dx «Dl = 1E 

Traceback (innermost last): 


File "«stdin»". line 1; in 2? 


AttributeError:  setitem 

>>> 

»»» sS[3:6] = 'DEF' 

Traceback (innermost last): 
bile "estdin»", line l1, in 3 

AttributeError:  setslice _ 


两 个 操作 都 抛 出 了 异常 。 为 了 实现 要 求 ， 我 们 需要 用 现 有 字符 串 的 子囊 来 构建 一 个 新 串 ， 然 
后 把 这 个 新 串 赋 给 原来 的 变量 。 


第 6 章 序列 : 字符 串 、 列 表 和 元 组 SM 


c s 
' abcdef' 
555 


»»» s = 'XsC*$s' *$ (s[0:2], sl3:1) 


> x 
'"abCdef' 
>>> 


DEE” 
' abCDEF' 


LESER SURE RC EG SL 0 RIRE T CEERI P AZERA ^ IE 48 S5 RE — 9 
完整 的 对 象 ， 比 如 说 一 个 字符 串 对 象 ， 不 能 是 字符 串 的 一 部 分 。 对 赋值 操作 的 右 值 没有 这 个 
限制 。 


6.8 Unicode 


从 Pythonl.6 起 引进 的 Unicode 字 符 串 支持 ， 是 用 来 在 多 种 双 字 节 字 符 的 格式 、 编 码 进行 转换 
的 ， 其 中 包括 一 些 对 这 类 字符 串 的 操作 管理 功能 。 内 建 的 字符 串 和 正则 表达 式 对 Unicode 字 符 
串 的 支持 ， 再 加 上 string 模 块 的 辅助 ，Python 已 经 可 以 应 付 大 部 分 应 用 对 Unicode 的 存储 、 访 
问 、 操 作 的 需要 了 。 我 们 会 尽 最 大 的 努力 把 Python 对 Unicode 的 支持 说 清楚 ， 但 在 这 之 前 ， 让 
我 们 先 讨论 一 些 基本 的 术语 ， 然 后 问 一 下 自己 ， 到 底 什 么 是 Unicode 。 


6.8.4 RE 





























表 6.8 Unicode 术语 
E a 
ASCII | LI tm "T 交换 确 
E n BMP | WEEPU GR CE ' 
BOM FUNUYIE (RFW) 
CJK/CIK V | bx.Hx.wx RAWD 的 缩写 
《 ode point m j ASCII 值 ,代表 Unicode yn Yn. 范围 在 ranget 1114112) 
Ju AE UL, 0x000000 到 Ox IOFFFF 
= Octet | \ 位 二 进 制 数 的 位 姐 
Erz Ere | 


UCS2 UCS (fnr 189) 5C CX, UTF-16) 





UCSA UCS 的 四 学 节 编 码 方式 ， 
UTI Unicode 或 者 UCS 的 转换 格式 ， 


UTF-$ 8 位 UTF 转换 格式 《无 符号 学 节 序 列 ， 长 度 为 1 一 4 个 字 节 ) . 





UTF-16 164 UTF 转换 格式 (无 符号 字 节 序列 ,通常 是 16 位 长 [两 个 党 节 ]， 
4 UCS2) 
| 


6.8.2 什么 是 Unicode 


Unicode 是 计算 机 可 以 支持 这 个 星球 上 多 种 语言 的 秘密 武器 。 在 Unicode 之 前 ， 用 的 都 是 
ASCII。ASCII 码 非常 简单 ， 每 个 英文 字符 都 是 以 7 位 二 进 制 数 的 方式 存 贮 在 计算 机 内 ， 其 范围 
是 32~126。 当 用 户 在 文件 中 键入 一 个 大 写字 符 A 时 ， 计 算 机 会 把 A 的 ASCII 码 值 65 写 入 磁盘 ， 
然后 当 计 算 机 读 取 该 文件 时 ， 它 会 首先 把 65 转 化 成 字符 A 然 后 显示 到 屏幕 上 。 


ASCII 编 码 的 文件 小 巧 易 读 。 一 个 程序 只 需 简单 地 把 文件 的 每 个 字 节 读 出 来 ， 把 对 应 的 数值 转 
换 成 字符 显示 出 来 就 可 以 了 。 但 是 ASCII 字 符 只 能 表示 95 个 可 打印 字符 。 后 来 的 软件 厂商 把 
ASCII 码 扩展 到 了 8 位 ， 这 样 一 来 它 就 可 以 多 标识 128 个 字符 ， 可 是 223 个 字符 对 需要 成 千 上 万 
的 字符 的 非 欧 洲 语系 的 语言 来 说 仍然 太 少 。 


Unicode 通 过 使 用 一 个 或 多 个 字 节 来 表示 一 个 字符 的 方法 突破 了 ASCII 的 限制 。 在 这 样机 制 
下 ，Unicode 可 以 表示 超过 90 000 个 字符 。 


6.8.3 怎样 使 用 Unicode 


早先 ，Python 只 能 处 理 8 位 的 ASCII 值 ， 字 符 串 就 是 简单 的 数据 类 型 ， 为 了 处 理 一 个 字符 串 ， 
用 户 必 须 首先 创建 一 个 字符 串 ， 然 后 把 它 作为 参数 传 给 string 模 块 的 一 个 函数 来 处 理 。2000 
年 ，Python 1.6 (和 2.0) 版 释 出 ，Unicode 第 一 次 在 Python 里 面 得 到 了 支持 。 


为 了 让 Unicode 和 ASCII 码 值 的 字符 串 看 起 来 尽 可 能 相像 ，Python 的 字符 串 从 原来 的 简单 数据 
XH PAY GOES) S. » ASCIEE I $ X T StringType > S Unicode ? 4f ¥ X f UnicodeType X 
型 。 它 们 的 行为 是 非常 相近 的 。string 模 块 里 面 都 有 相应 的 处 理 函 数 。string 模 块 已 经 停止 了 更 
新 ， 只 保留 了 ASCII 码 的 支持 ，string 模 块 已 经 不 推荐 使 用 ， 在 任何 需要 跟 Unicode 兼 容 的 代码 
里 都 不 要 再 用 该 模块 ，Python 保 留 该 模块 仅仅 是 为 了 向 后 兼容 。 


Python 里 面 处 理 Unicode 字 符 串 跟 处 理 ASCII 字 符 串 没什么 两 样 。Python 把 硬 编码 的 字符 串 叫 
做 字面 上 的 字符 串 ， 黑 认 所 有 字面 上 的 字符 串 都 用 ASCII 编 码 ， 可 以 通过 在 字符 串 前 面 加 一 


个 必 前 缓 的 方式 声明 Unicode 字 符 串 ， 这 个 必 前 缓 告诉 Python 后 面 的 字符 串 要 编码 成 Unicode 
字符 串 。 


>>> "Hello World" # ASCII string 


>>> u"Hello World" # Unicode string 


内 建 的 str() 函 数 和 chr() 函 数 并 没有 升级 成 可 以 处 理 Unicode。 它 们 只 能 处 理 常 规 的 ASCI 编 码 
字符 串 ， 如 果 一 个 Unicode 字 符 串 被 作为 参数 传 给 了 str() 函 数 ， 它 会 首先 被 转换 成 ASCII 字 符 
串 然 后 在 交 给 str() 函 数 。 如 果 该 Unicode 字 符 串 中 包含 任何 不 被 ASCII 字 符 串 支持 的 字符 ， 会 
导致 str() 函 数 报 异 常 。 同 样 地 ，chr() 函 数 只 能 以 0~255 作 为 参数 工作 。 如 果 你 传 给 它 一 个 超出 
此 范围 的 值 (比如 说 一 个 Unicode 字 符 ) > CARAF ° 


385 A 3€ à Zicunicode()feunichar() T 2 Æ Unicode A $9 str()fechr() ° Unicode() $% Zc T v4 
把 任何 Python 的 数据 类 型 转换 成 一 个 Unicode 字 符 事 ， 如 果 是 对 象 ， 并 且 该 对 象 定义 了 
__Unicode”() 方 法 ， 它 还 可 以 把 该 对 象 转换 成 相应 的 Unicode 字 符 囊 。 具 体内 容 见 6.1.3 和 
6.5.3 节 。 


6.8.4 Codec 有 是 什么 


codec 是 COder/DECoder 的 首 字 母 组 合 。 它 定义 了 文本 跟 二 进 制 值 的 转换 方式 ， 跟 和 SCII 那 种 
用 一 个 字 节 把 字符 转换 成 数字 的 方式 不 同 ，Unicode 用 的 是 多 字 节 。 这 导致 了 Unicode 支 持 多 
种 不 同 的 编码 方式 。 比 如 说 codec 支 持 的 4 种 耳熟能详 的 编码 方式 : ASCII ^ ISO 8859-1/Latin- 
1、UTF-8 和 UTF-16。 


其 中 最 著名 的 是 UTF-8 编 码 ， 它 也 用 一 个 字 节 来 编码 ASCIll 字 符 ， 这 让 那些 必须 同时 处 理 
ASCIl 码 和 Unicode 码 文本 的 程序 员 的 工作 变 得 非常 轻松 ， 因 为 ASCll 字 符 的 UTF-8 编 码 跟 
ASCII 编 码 完全 相同 。 


UTF-8 编 码 可 以 用 1~4 个 字 节 来 表示 其 他 语言 的 字符 ，CJK/East 这 样 的 东亚 文字 一 般 都 是 用 3 
个 字 节 来 表示 ， 那 些 少 用 的 、 特 殊 的 或 者 历史 遗留 的 字符 用 4 个 字 节 来 表示 。 这 给 那些 需要 直 
接 处 理 Unicode 数 据 的 程序 员 带 来 了 麻烦 ， 因 为 他 们 没有 办 法 按照 固定 长 度 逐 一 读 出 各 个 字 
符 。 幸 运 的 是 我 们 不 需要 掌握 直接 读 写 Unicode 数 据 的 方法 ，Python 已 经 替 我 们 完成 了 相关 细 
节 ， 我 们 无 须 为 处 理 多 字 节 字符 的 复杂 问题 而 担心 。Python 里 面 的 其 他 编码 不 是 很 常用 ， 事 
实 上 ， 我 们 认为 大 部 分 的 Python 程 序 员 根本 就 用 不 着 去 处 理 其 他 的 编码 ，UTF-16 可 能 是 个 例 
外 。 


UTF-16 可 能 是 以 后 大 行 其 道 的 一 种 编码 格式 ， 它 容易 读 写 ， 因 为 它 把 所 有 的 字符 都 是 用 单独 
的 一 个 16 位 字 ， 两 个 字 节 来 存储 的 ， 正 因为 此 ， 这 两 个 字 节 的 顺序 需要 定义 一 下 ， 一 般 的 
UTF-16 编 码 文件 都 需要 一 个 BOM (位 顺序 标记 ，Byte Order Mark) ， 或 者 你 显 式 地 定义 
UTF-16-LE (4h35) 或 者 UTF-16-BE (大 端 ) 字 节 序 。 


从 技术 上 讲 ，UTF-16 也 是 一 种 变 长 编码 ， 但 它 不 是 很 常用 (人 们 一 般 不 会 知道 或 者 根本 不 在 
意 除 了 基本 多 文 种 平面 BMP 之 外 到 底 使 用 的 是 那 种 平面 ) ， 尽 管 如 此 ，UTF-16 并 不 向 后 兼容 
ASCII， 因 此 ， 实 现 它 的 程序 很 少 ， 因 为 大 家 需要 对 ASCII 进 行 支持 。 


6.8.5 ”编码 解码 


Unicode 支 持 多 种 编码 格式 ， 这 为 程序 员 带 来 了 额外 的 负担 ， 每 当 你 向 一 个 文件 写 入 字符 串 的 
时 候 ， 你 必须 定义 一 个 编码 《encoding 参数 ) 用 于 把 对 应 的 Unicode 内 容 转换 成 你 定义 的 格 
式 ，Python 通 过 Unicode 字 符 串 的 encode() 函 数 解决 了 这 个 问题 ， 该 函数 接受 字符 串 中 的 字符 
为 参数 ， 输 出 你 指定 的 编码 格式 的 内 容 。 


所 以 ， 每 次 我 们 写 一 个 Unicode 字 符 串 到 磁盘 上 我 们 都 要 用 指定 的 编码 器 给 他 “编码 "一 下 。 相 
应 地 ， 当 我 们 从 这 个 文件 读 取 数据 时 ， 我 们 必须 “解码 "该 文件 ， 使 之 成 为 相应 的 Unicode 字 符 
串 对 象 。 


1. 简单 的 例子 


下 面 的 代码 创建 了 一 个 Unicode 字 符 串 ， 用 UTF-8 编 码 器 将 它 编 码 ， 然 后 写 入 到 一 个 文件 中 
囊 ， 用 以 确认 程序 正确 地 运行 。 


2. 和 逐 行 解释 


像 通常 一 样 ， 首 先 定 义 了 doc 字 符 串 和 用 以 表示 解码 器 的 常量 ， 还 有 用 以 存储 字符 串 的 文件 
名 。 


第 9 ~ 19 行 


我 们 创建 了 一 个 Unicode 字 符 串 ， 用 我 们 指定 的 编码 格式 对 其 进行 编码 ， 然 后 把 它 写 入 到 文件 
中 去 ， (9-13 行 ) ， 接 着 我 们 把 内 容 从 文件 中 重新 读 出 来 。 解 码 ， 显 示 到 屏幕 上 ， 输 出 的 时 
候 去 掉 print 的 自动 换行 ， 因 为 我 们 已 经 在 字符 串 中 写 了 一 个 换行 符 〈15~19 行 ) 。 


例 6.2 简单 Unicode 字 符 串 例子 (uniFile.py) 


这 个 简单 的 例子 中 ， 我 们 把 一 个 Unicode 字 符 串 写 入 到 磁盘 文件 ， 然 后 再 把 它 读 出 并 显示 出 
来 。 写 入 的 时 候 用 UTF-8 编 码 ， 读 出 也 一 样 ， 用 UTF-8 。 


l # /usr/bin/env python 


An example of reading and writing Unicode strings:Writes 


B a Unicode string to a file in utf-8 and reads it 


€ CODEC-'utf-8"' 
7 FILE-'unicode.txt"' 
4 
) hell out u”Heėll ^ id 
10 bytes_out hello out.encode (CODEC) 
11 f "open(FILE, "w") 
f.write(bytes out) 
3 f.close() 
14 
15 f open(FILE, "r") 


16 bytes in * f.read() 
17 f.close() 
18 hello in = bytes in.decode (CODEC) 


运行 该 程序 ， 我 们 得 到 如 下 的 输出 。 
$ unicode example.py 


Hello World 


在 文件 系统 中 也 会 发 现 一 个 叫 unicode.txt 的 文件 ， 里 面包 含 跟 输 出 的 内 容 一 致 的 数据 。 
$ cat unicode.txt 


Hello World! 


3. 简单 Web 例 子 


在 第 20 章 Web 编 程 里 面 我 们 展示 了 一 个 简单 的 在 CGI 应 用 中 使 用 Unicode 的 例子 。 


6.8.6 把 Unicode 应 用 到 实际 应 用 中 


这 些 处 理 Unicode 字 符 囊 的 例子 简单 到 让 人 感到 有 点 假 ， 事 实 上 ， 只 要 你 遵守 以 下 的 规则 ， 处 
理 Unicode 就 是 这 么 简单 。 


e 程序 中 出 现 字符 囊 时 一 定 要 加 个 前 级 U。 


。 不 要 用 str() 函 数 ， 用 unicode() 代 替 。 


e 不 要 用 过 时 的 String 模块 一 如 果 传 给 它 的 是 非 ASCII 字 符 ， 它 会 把 一 切 搞 砸 。 


e 不 到 必须 时 不 要 在 你 的 程序 里 面 编 解 码 Unicod 字 符 。 只 在 你 要 写 入 文件 或 数据 库 或 者 网 
络 时 ， 才 调用 encode() 有 函数 ; 相应 地 ， 只 在 你 需要 把 数据 读 回来 的 时 候 才 调用 decode() 函 
数 。 


这 些 规则 可 以 规避 90% 由 于 Unicode 字 符 串 处 理 引起 的 bug。 现 在 的 问题 是 剩 下 的 10% 的 问题 
却 让 你 处 理 不 了 ， 幸 亏 Python 提 供 了 大 量 的 模块 、 库 来 替 你 处 理 这 些 问题 。 它 们 可 以 让 你 用 

10 行 Python 语 句 写 出 其 他 语言 需要 100 行 语句 才能 完成 的 功能 ， 但 是 相应 地 ， 对 Unicode 支 持 
的 质量 也 完全 取决 于 这 些 模块 、 库 。 


Python 标准 库 里 面 的 绝 大 部 分 模块 都 是 兼容 Unicode 的 ， 除 了 pickle 模 块 ! pickle 模 块 只 支持 
ASCII 字 符 串 。 如 果 你 把 一 个 Unicode 字 符 串 交 给 pickle 模 块 来 Unpickle， 它 会 报 异 常 。 你 必须 
先 把 你 的 字符 串 转 换 成 ASCII 字 符 串 才 可 以 。 所 以 最 好 是 避免 基于 文本 的 pickle 操 作 。 幸 运 地 
是 现在 二 进 制 格式 已 经 作为 pickle 的 默认 格式 了 ，pickle 的 二 进 制 格式 支持 不 错 。 这 点 在 你 向 
数据 库 里 面 存 东西 是 尤为 突出 ， 把 它们 作为 BLOB 字 段 存 储 而 不 是 作为 TEXT 或 者 VARCHAR 
字段 存储 要 好 很 多 。 万 一 有 人 把 你 的 字段 改 成 了 Unicode 类 型 ， 这 可 以 避免 pickle 的 衣 溃 。 


如 果 你 的 程序 里 面 用 到 了 很 多 第 三 方 模块 ， 那 么 你 很 可 能 在 各 个 模块 统一 使 用 Unicode 通 讯 方 
面 遇 到 麻烦 ，Unicode 还 没 成 为 一 项 必须 的 规定 ， 在 你 系统 里 面 的 第 三 方 模块 (包括 你 的 应 用 
要 面 对 的 平台 \ 系 统 ) 需要 用 相同 的 Unicode 编 码 ， 否 则 ， 可 能 你 就 不 能 正确 的 读 写 数据 。 
作为 一 个 例子 ， 假 设 你 正在 构建 一 个 用 数据 库 来 读 写 Unicode 数 据 的 Web 应 用 。 为 了 支持 
Unicode， 你 必须 确保 以 下 方面 对 Unicode 的 支持 。 


e 数据 库 服 务 器 (MySQL、PostgreSQL、SQL Server 等 ) 

e 数据 库 适 配器 (MySQLdb 等 ) 

e Web 开 发 框架 (mod_python 、cgi,Zope、Plane、Dijango 等 ) 
数据 库 方面 最 容易 对 付 ， 你 只 要 确保 每 张 表 都 用 UTF-8 编 码 就 可 以 了 。 


数据 库 适 配器 可 能 有 点 麻烦 ， 有 些 适 配器 支持 Unicode 而 有 些 不 支持 。 比 如 说 MySQLdb， 它 
并 不 是 默认 就 支持 Unicode 模 式 ， 你 必须 在 connect() 方 法 里 面 用 一 个 特殊 的 关键 字 
use_unicode 来 确保 你 得 到 的 查询 结果 是 Unicode 字 符 串 。mod _ python 里 面 开启 对 Unicode 的 
支持 相当 简单 ， 只 要 在 request 对 象 里 面 把 text-encoding 一 项 设 成 “utf-8” 就 行 了 ， 剩 下 的 
mod_python 都 会 蔡 你 完成 ，Zope 等 其 他 复杂 的 系统 可 能 需要 更 多 的 工作 来 支持 Unicode 。 


6.8.7 从 现实 中 得 来 的 教训 


失误 #1 : 你 必须 在 一 个 极 有 限 的 时 间 内 写 出 一 个 大 型 的 应 用 ， 而 且 需 要 其 他 语言 的 支持 ， 但 
是 产品 经 理 并 没有 明确 定义 这 一 点 。 你 并 没有 考虑 Unicode 的 兼容 ， 直 到 项 目 快要 结束 .……… 这 
时 候 再 添加 Unicode 的 支持 几乎 不 太 可 能 ， 不 是 吗 ? 


结果 #1 : 没 能 预测 到 最 终 用 户 对 其 他 语言 界面 的 需求 ， 在 集成 他 们 用 的 面向 其 他 语种 的 应 用 
时 又 没有 使 用 Unicode 支 持 。 更 新 整个 系统 既 让 人 觉得 枯燥 ， 又 浪费 时 间 。 


失误 #2 : 在 源码 中 到 处 使 用 string 模 块 或 者 str() 和 chr() 函 数 。 


结果 #2 : 通过 全 局 的 查找 替换 把 str() 和 chr() 替 换 成 unicode() 和 unichr()， 但 是 这 样 一 来 很 可 能 
就 不 能 再 用 pickle 模 块 ， 要 用 的 话 只 能 把 所 有 要 pickle 处 理 的 数据 存 成 二 进 制 形 式 ， 这 样 一 来 
就 必须 修改 数据 库 的 结构 ， 而 修改 数据 库 结构 就 意味 着 全 部 推倒 重 来 。 


失误 #3 : 不 能 确定 所 有 的 辅助 系统 都 完全 地 支持 Unicode 。 


结果 #3 : 不 得 不 去 为 那些 系统 打 补 丁 ， 而 其 中 有 些 系统 可 能 你 根本 就 没有 源码 。 修 复 对 
Unicode 支 持 的 bug 可 能 会 降低 代码 的 可 靠 性 ， 而 且 非 常 有 可 能 引入 新 的 bug 。 


总 结 : 使 应 用 程序 完全 支持 Unicode， 兼 容 其 他 的 语言 本 身 就 是 一 个 工程 。 


它 需要 详细 的 考虑 、 计 划 。 所 有 涉及 的 软件 、 系 统 都 需要 检查 ， 包 括 Python 的 标准 库 和 其 他 
将 要 用 到 的 第 三 方 扩展 模块 。 你 甚至 有 可 能 需要 组 建 一 个 经 验 丰 富 的 团队 来 专门 负责 国际 化 
(118N ) 问题 。 


6.8.8 Python 的 Unicode 支 持 
1. 内 建 的 unicode() 有 函数 


Unicode 的 工厂 方法 ， 同 Unicode 字 符 串 操作 符 〈UU ) 的 工作 方式 很 类 似 ， 它 接受 一 个 string 
做 参数 ， 返 回 一 个 Unicode 字 符 串 。 


2. 内 建 的 decode()/encode() 方 法 


decode() 和 encode() 内 建 函 数 接受 一 个 字符 串 做 参数 返回 该 字符 串 对 应 的 解码 后 /编码 后 的 字 
符 串 。decode() 和 encode() 都 可 以 应 用 于 常规 字符 串 和 Unicode 字 符 串 。decode() 方 法 是 在 
Python2.2 以 后 加 入 的 。 


3. Unicode 类 型 


Unicode 字 符 串 对 象 是 basestring 的 子 类 、 用 Unicode() 工 厂 方法 或 直接 在 字符 串 前 面 加 一 个 U 
或 者 U 来 创建 实例 。 支 持 Unicode 原 始 字符 串 ， 只 要 在 你 的 字符 串 前 面 加 一 个 ur 或 者 UR 就 可 以 
fun 


4. ”Unicode 序数 


标准 内 建 函 数 ord() 工 作 方 式 相 同 ， 最 近 已 经 升级 到 可 以 支持 Unicode 对 象 了 。 内 建 的 unichr() 
遂 数 返回 一 个 对 应 的 Unicode 字 符 (需要 一 个 32 位 的 值 ) ; 否则 就 产生 一 个 ValueError 蜡 常 。 


5. 强制 类 型 转换 


混合 类 型 字符 串 操 作 需 要 把 普通 字符 串 转 换 成 Unicode 对 象 。 


6. 异常 


UnicodeError 措 常 是 在 exceptions 模 块 中 定义 的 ，ValueError 的 子 类 。 所 有 关于 Unicode 编 解 
码 的 异常 都 要 继承 自 UnicodeError。 详 见 encode() 函 数 。 


7T. 标准 编码 


表 6.9 简 洁 地 列 出 了 Python 中 常用 的 编码 方式 。 更 详细 、 完 全 的 列表 见 Python 文档 ， 下 面 是 它 
的 链接 。 


http://docs.python.org/lib/standard-encodings.html 


8. RE 引擎 对 Unicode 的 支持 


正则 表达 式 引 擎 需要 Unicode 支 持 。 详 见 6.9 节 的 re 模块 。 





























369 常用 Unicode 编辑 码 
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9. 字符 串 格 式 化 操作 符 


对 于 Python 的 格式 化 字符 串 的 操作 符 ，%s 把 Python 字符 串 中 的 Unicode 对 象 执 行 了 str (u) 
操作 ， 所 以 ， 输 出 的 应 该 是 u.encode (默认 编码 ) 。 如 果 格 式 化 字符 囊 是 Unicode 对 象 ， 所 有 
的 参数 都 将 首先 强制 转换 成 Unicode 然 后 根据 对 应 的 格式 串 一 起 进行 格式 转换 。 数 字 首 先 被 转 
换 成 普通 字符 串 ， 然 后 在 转换 成 Unicode。Python 字 符 串 通过 默认 编码 格式 转化 成 Unicode。 
Unicode 对 象 不 变 ， 所 有 其 他 格式 字符 串 都 需要 像 上 面 这 样 转化 ， 下 面 是 例子 。 


Te Tabet: S iape abes 


6.9 相关 模块 


表 6.10 列 出 了 Python 标准 库 里 面 与 字符 串 有 关 的 主要 模块 。 


3& 6.10 与 字符 串 类 型 有 关 的 模块 
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a. Python2.1 新 加 ， 
b. Python2.5 新 加 ， 
€. Python22 新 加 ， 
d. Python2.5 的 hashlib 中 废除 ， 
e. Python2.3 新 加 ， 
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正则 表达 式 (RE) 提供 了 高 级 的 字符 串 模 式 匹 配方 案 。 通 过 描述 这 些 模式 的 语法 ， 你 可 以 像 
使 用 “过滤 器" 一样 高 效 地 查找 传 进来 的 文本 。 这 些 过 滤器 允许 你 基于 自 定义 的 模式 字符 串 抽取 
匹配 模式 、 执 行 查找 - 蔡 换 或 分 割 字符 囊 。 


核心 模块 : re 


Python 1.5 中 加 入 的 re 模块 代 蔡 了 早期 的 regex 和 regsub 模 块 ， 全 面 采 用 了 Perl 正 则 表达 式 语 
法 ， 使 得 Python 在 对 正则 表达 式 的 支持 方面 前 进 了 一 大 步 。Python 1.6 里 面 重 写 了 正则 表达 式 
引擎 (SRE) ， 增 加 了 对 Unicode 字 符 串 的 支持 并 对 性 能 进行 了 重大 的 升级 。SRE 引 擎 取代 了 
原 有 正则 表达 式 的 模块 下 的 PCRE 引 擎 。 


该 模块 中 包含 的 关键 函数 有 : compile()- 将 一 个 RE 表达 式 编译 成 一 个 可 重用 的 RE 对 象 ; 
match()- 试 图 从 字符 串 的 开始 匹配 一 个 模式 ; search()- 找 出 字符 串 中 所 有 匹配 的 项 ; sub()- 进 
行 查找 替换 操作 。 其 中 的 一 些 函 数 返回 匹配 到 的 对 象 ， 你 可 以 通过 组 匹配 来 访问 〈 如 果 找 到 
的 话 ) 。15 章 整 章 的 内 容 都 是 讲述 正则 表达 式 的 。 


6.10 字符 串 关键 点 总 结 


1， 一 些 引号 分 隔 的 字符 


你 可 以 把 字符 串 看 成 是 Python 的 一 种 数据 类 型 ， 在 Python 单 引号 或 者 双 引 号 之 问 的 字符 数组 
或 者 是 连续 的 字符 集合 。 在 Python 中 最 常用 两 个 引号 是 单 引 号 C) 和 双 引 号 C) 。 字 符 串 的 
实际 内 容 是 这 些 单 引 号 C) 或 者 双 引 号 (C) 之 间 的 字符 ， 不 包括 引号 本 身 。 


可 以 用 两 种 引号 来 创建 字符 
AT 


是 很 有 益处 的 ， 因 为 是 当 你 的 字符 串 中 包含 单 引 号 时 ， 如 果 用 
单 引号 创建 字符 串 ， 那 $ 


$ 
符 串 中 的 双 引 号 就 不 需要 转 义 。 反 之 亦 然 。 


符 串 是 唯一 的 字面 上 的 字符 序列 类 型 。 不 过 ， 字 符 本 身 并 不 是 一 种 类 型 ， 所 以 ， 字 符 串 是 
符 存 储 操作 的 最 基本 单位 。 字 符 应 该 视 为 长 度 为 1 的 字符 囊 。 


3. 字符 串 格式 化 操作 符 〈%) 提供 类 似 printf() 的 功能 


字符 囊 格 式 化 操作 符 ( 见 6.4.1 节 ) 提供 了 一 种 基于 多 种 输入 类 型 的 创建 自 定义 字符 串 的 灵活 
方式 。 它 也 提供 了 类 似 于 C/C++ 世界 里 的 格式 化 操作 的 接口 。 


4. 三 引号 


在 6.7.2 节 里 面 ， 我 们 介绍 了 三 引号 ， 在 三 引号 字符 串 中 可 以 包含 诸如 换行 回 车 或 者 tab 键 这 样 
的 特殊 字符 。 三 引号 字符 串 是 用 两 边 各 三 个 单 引 号 (”) 或 者 两 边 各 三 个 双 引 号 (”) 来 定义 
的 。 


5. 原始 字符 串 对 每 个 特殊 字符 串 都 使 用 它 的 原意 


第 6.4.2 节 中 ， 我 们 讲述 了 原始 字符 囊 ， 并 且 讨 论 了 它们 并 不 通过 反 儿 线 转 义 特殊 字符 的 特 
性 。 这 个 特性 使 得 原始 字符 囊 非常 适用 于 那些 需要 字符 串 原 意 的 场合 ， 比 如 在 定义 一 个 正则 
表达 式 时 。 


6. Python 字符 串 不 是 通过 NUL 或 者 \0' 来 结束 的 


C 编 程 的 一 个 主要 问题 是 你 访问 了 一 个 字符 串 后 面 的 本 不 属于 你 的 空间 ， 这 种 情况 发 生 在 你 没 
有 在 字符 串 末 尾 添加 终结 符 、NUL 或 者 \0' (ASCII 值 为 0) 的 时 候 。Python 不 仅 为 你 自动 管理 
内 存 ， 而 且 也 把 C 的 这 个 负担 或 者 说 是 小 麻烦 去 掉 了 。Python 中 的 字符 囊 不 是 以 NUL 结 束 的 ， 
所 以 你 不 需要 为 是 否 已 经 添加 终结 符 担心 。 字 符 串 中 只 包含 你 所 定义 的 东西 ， 没 有 别 的 。 


6.11 列表 


像 字符 串 类 型 一 样 ， 列 表 类 型 也 是 序列 式 的 数据 类 型 ， 可 以 通过 下 标 或 者 切片 操作 来 访问 某 
一 个 或 者 某 一 块 连续 的 元 素 。 然 而 ， 相 同 的 方面 也 就 这 些 ， 字 符 串 只 能 由 字符 组 成 ， 而 且 是 
不 可 变 的 《不 能 单独 改变 它 的 某 个 值 ) ， 而 列表 则 是 能 保留 任意 数目 的 Python 对 象 的 灵活 的 
容器 。 就 像 我 们 将 要 看 到 的 例子 中 所 示 ， 创 建 列 表 非 常 简单 ， 向 列表 中 添加 元 素 也 是 如 此 。 


列表 不 仅 可 以 包含 Python 的 标准 类 型 ， 而 且 可 以 用 用 户 定 义 的 对 象 作为 自己 的 元 素 。 列 表 可 
以 包含 不 同类 型 的 对 象 ， 而 且 要 比 C 或 者 Python 自己 的 数组 类 型 (包含 在 array 扩 展 包 中 ) 都 
要 灵活 ， 因 为 数组 类 型 所 有 的 元 素 只 能 是 一 种 类 型 。 列 表 可 以 执行 pop,empt、sort、reverse 
等 操作 。 列 表 也 可 以 添加 或 者 减少 元 素 ， 还 可 以 跟 其 他 的 列表 结合 或 者 把 一 个 列表 分 成 几 
个 。 可 以 对 单独 一 个 元 素 或 者 多 个 元 素 执 行 insert、update 或 remove 操 作 。 


元 组 类 型 在 很 多 操作 上 都 跟 列 表 一 样 ， 许 多 用 在 列表 上 的 例子 在 元 组 上 照样 能 跑 ， 我 们 有 一 
节 内 容 专 门 讲解 元 组 类 型 。 它 们 的 主要 不 同 在 于 元 组 是 不 可 变 的 ， 或 者 说 是 只 读 的 ， 所 以 那 
些 用 于 更 新 列表 的 操作 ， 比 如 用 切片 操作 来 更 新 一 部 分 元 素 的 操作 ， 就 不 能 用 于 元 组 类 型 。 


1. 如 何 创建 列表 类 型 数据 并 给 它 赋 值 


创建 一 个 列表 就 像 给 一 个 变量 赋值 一 样 的 简单 。 你 手工 写 一 个 列表 ( 空 的 或 者 有 值 的 都 行 ) 
然后 赋值 给 一 个 变量 ， 列 表 是 由 方 括号 QD 来 定义 的 ， 当 然 ， 你 也 可 以 用 工厂 方法 来 创建 


"uo 
"o» Wbist o - [123, 'abc', 4.56, E'inner', "I1xSt'], 7-93] 
>>> anotherList = [None, 'something to see here'] 


>>> print aList 

[125,. "abe"; 4.56, ['inner', 'list'], (7-932] 
>>> print anotherList 

[None, 'something to see here'] 

>>> aListThatStartedEmpty = [] 

>>> print aListThatStartedEmpty 

[] 

>>> list('foo') 


[*£" Vet, Eo 


2. 如 何 访问 列表 中 的 值 


列表 的 切片 操作 就 像 字符 囊 中 一 样 ; 切片 操作 符 (D 和 索引 值 或 索引 值 范围 一 起 使 用 。 
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>>> aList[0] 

123 

>>> aList[1:4] 

['abc', 4.55, ['dnner', "list'l] 
>>> anist[rs:3] 

[I23, "abe! p 4.56] 

>>> aList[3][1] 

Clist' 


3. 如 何 更 新 列表 


你 可 以 通过 在 等 号 的 左边 指定 一 个 索引 或 者 索引 范围 的 方式 来 更 新 一 个 或 几 个 元 素 ， 也 可 以 
用 append() 方 法 来 追加 元 素 到 列表 中 去 。 

>>> aList 

(123, 'abc', 4.56, ['inner', 'list'], (7-91)] 

>>> aList[2] 

4.56 

>>> aList[2] = 'float replacer' 

>>> aList 

[123, 'abc',; 'f£losat replacer', ['inner', 'list'], (7-93)] 

>>> 

>>> anotherlist.append("hi, i'm new here") 

>>> print anotherList 

(None, 'something to see here', "hi, i'm new here"] 

>>> aListThatStartedEmpty.append('not empty anymore') 

22» print aListThatStartedEmpty 


['not empty anymore'] 


4. 如 何 删除 列表 中 的 元 素 或 者 列表 (RA) 


要 删除 列表 中 的 元 素 ， 如 果 你 确切 的 知道 要 删除 元 素 的 素 引 可 以 用 del 语 如， 否则 可 以 用 
remove() 方 法 。 


第 6 章 序列 : 字符 串 、 列 表 和 元 组 


一 
A 

O 
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>>> aList 

(123, 'abc', 'float replacer', ['inner', 'list'], (7-93)] 
»»» del aList[1] 

>>> aList 

(123, 'float replacer', ['inner', 'list'], (7-93)] 

>>> aList.remove(123) 

>>> aList 

['float replacer', ['inner', *'list'], (7-93)] 


你 还 可 以 通过 pop() 方 法 来 删除 并 从 列表 中 返回 一 个 特定 对 象 。 


一 般 来 说 ， 程 序 员 不 需要 去 删除 一 个 列表 对 象 。 列 表 对 象 出 了 作用 域 (比如 程序 结束 ， 函 数 
调用 完成 等 等 ) 后 它 会 自动 被 析 构 ， 但 是 如 果 你 想 明 确 的 删除 一 整个 列表 ， 你 可 以 用 del 语 
4 : 


del aList 


6.12 操作 符 


6.12.1 标准 类 型 操作 符 


在 第 4 章 里 ， 我 们 介绍 了 一 些 适用 于 包括 标准 类 型 在 内 的 大 部 分 对 象 的 操作 符 ， 现 在 我 们 来 看 
一 下 这 些 操作 符 如 何 作用 在 列表 上 。 


>>> Iistl  ['abe'. 123] 
['xyz', 799] 
"ape"; 123] 
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»»» list2 


SS Fists 


True 

>>> list2 < list3 

False 

>>> list2 > list3 and listi == list3 


True 


在 使 用 比较 操作 符 时 ， 比 较 数字 和 字符 串 是 很 明了 的 ， 但 是 用 在 列表 上 时 就 不 是 那么 简单 

了 。 列 表 比 较 操作 有 些 狐 独 ， 但 是 合乎 逻辑 。 比 较 列 表 时 也 是 用 的 内 建 的 cmp() 元 数 ， 基 本 的 
比较 逻辑 是 这 样 的 : 两 个 列表 的 元 素 分 别 比较 ， 直 到 有 一 方 的 元 素 胜出 ， 比 如 我 们 上 面 的 例 
子 ，‘abc' 和 ‘xyz' 的 比较 直接 决定 了 上 比较 结果 ， 在 ‘abc'<'xyz' 时 ，list1<list2,list2>=list3， 元 组 类 
型 在 进行 比较 操作 时 跟 列 表 遵 循 相同 的 逻辑 。 


6.12.2 Æ 9| & HIER 


1. wä (QU T9) 


列表 的 切片 操作 跟 字 符 串 的 切片 操作 很 像 ， 不 过 列表 的 切片 操作 返回 的 是 一 个 对 象 或 者 是 几 
个 对 象 的 集合 ， 而 不 是 像 字 符 串 那样 ， 返 回 一 个 字符 或 者 一 个 子囊 。 我 们 定义 以 下 几 个 列表 
用 来 做 例子 。 


>>> num list = [43, -1.23, -2, 6.19e5] 
>>> str list = ['jack', 'jumped', 'over', 'candlestick'] 
>>> mixup list = [4.0, [1, 'x'], 'beef', -1.9*6j] 


列表 的 切片 操作 也 遵从 正 负 索 引 规则 ， 也 有 开始 索引 值 ， 结 束 索 引 值 ， 如 果 这 两 个 值 为 空 ， 
默认 也 会 分 别 指 到 序列 的 开始 和 结束 位 置 。 


一 
一 

oO 

= 


>>> num list[1] 

-— L3 

>>> 

PP num list[l:] 

[71.23, -2, 619000.0] 

SS 

»»» num list[2:-1] 

[^4] 

>>> 

»»» str list[2] 

'over' 

»»» str list[:2] 

['jack', 'jumped'] 

>>> 

>>> mixup list 

[1,0, Il; 'x'], "béef', (-L.99561)] 

>>> mixup list[1] 

[lis Te 
跟 字 符 串 类 型 只 能 用 字符 为 元 素 不同 ， 列 表 类 型 的 元 素 可 以 是 另 一 个 序列 类 型 ， 这 就 意味 着 
你 在 列表 的 元 素 上 也 可 以 使 用 所 有 的 序列 操作 符 或 者 在 其 上 执行 序列 类 型 内 建 的 各 种 操作 。 
在 下 面 的 例子 中 ， 我 们 将 会 展示 ， 不 仅 可 以 在 一 个 切片 操作 的 结果 之 上 再 进行 切片 ， 而 且 还 


可 以 改变 这 个 切片 的 结果 ， 即 使 新 对 象 的 类 型 跟 原 对 象 不 同 也 可 以 。 你 会 注意 到 ， 这 跟 多 维 
数组 有 一 些 类 似 。 
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»»» mixup list[1][1] 

"x" 

>>> mixup list[1][1] = -64.875 

>>> mixup list 

[4;0, [1, -64.875], 'beef', (-1.9*63)] 


这 时 用 num_list 来 做 的 另 一 个 例子 : 

>>> num list 

(43; -1.23, -2, 6.19e5] 

>>> 

>>> num list[2:4] = [16.0, -49] 

>>> 

>>> num list 

[43, -1.23, 16.0, -49] 

>>> 

>>> num list[0] = [65535L, 2e30, 76.45-1.3j] 

>>> 

>>> num list 

[[65535L, 2e*30, (76.45-1.3j)], -1.23, 16.0, -49] 
注意 在 最 后 一 个 例子 中 ， 我 们 是 如 何 把 列表 的 单一 元 素 替 换 成 一 个 列表 。 在 列表 中 进行 诸如 
remove、add 和 [replace 的 操作 是 多 么 的 自由 了 吧 | 还 有 一 点 要 注意 ， 如 果 你 想 以 子 列 表 的 形 
式 得 到 一 个 列表 中 的 一 个 切片 ， 那 需要 确保 在 赋值 时 等 号 的 左边 也 是 一 个 列表 而 不 是 一 个 列 
表 的 元 素 。 
2. 成 员 关 系 操作 (in not in) 


列表 中 (同样 适用 于 元 组 ) ， 我 们 可 以 检查 一 个 对 象 是 否 是 一 个 列表 (或 者 元 组 ) 的 成 员 。 
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>>> mixup list 
[4.0, [1, 
>>> 


'x'], 'beef', 
>>> 'beef' in mixup list 
True 
>>> 
>>> 'x' in mixup list 
False 

>>> 
>>> 'x' in mixup list[1] 
True 

>>> num list 
[[65535L, 2e*030, 


>>> 


(76.45-1.33)], 


>>> -49 in num list 
True 

>>> 

>>> 34 in num list 
False 

>>> 

»»» [65535L, 


True 


2e*030, 


(-1.9463)] 


-1.23, 16.0, -49] 


(76.45-1.3j)] in num list 


注意 ，'X' 并 不 属于 mixup_list， 因 为 Xx 本 身 并 不 是 mixup_list 的 一 个 成 员 ， 而 是 mixup_list[1] 
的 ，mixup_list[1] 也 是 一 个 列表 类 型 。 成 员 关 系 操作 运算 同样 适用 于 元 组 类 型 。 


3. 连接 操作 符 (+) 


连接 操作 符 允许 我 们 把 多 个 列表 对 象 合并 在 一 起 。 注 意 ， 列 表 类 型 的 连接 操作 也 只 能 在 同类 
型 之 间 进 行 ， 换 和 句 话说 ， 你 不 能 把 两 个 不 同类 型 的 对 象 连接 在 一 起 ， 即 便 他 们 都 是 序列 类 型 


也 不 行 。 

>>> num list = [43, -1.23, -2, 6.19e5] 
>>> str list = ['jack', 'jumped', 'over', 
>>> mixup list = [4.0, [1, 'x'], 'beef', 
>>> 

>>> num list + mixup list 

(43, -1.23, -2, 619000.0, 4.0, Il, 'x'], 
>>> 

»»» str list + num list 

['jack', 'jumped', 'over', 'candlestick', 


'candlestick'] 


-1.9*63] 
'beef', (-1.9*6j)] 
43, -1.23, -2, 619000.0) 
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在 6.23 节 里 面 我 们 会 讲 到 ， 从 Python 1.5.2 起 ， 我 们 可 以 用 extend() 方 法 来 代替 连接 操作 符 把 

一 个 列表 的 内 容 添加 到 另 一 个 中 去 。 使 用 extend() 方 法 比 连接 操作 的 一 个 优点 是 它 实际 上 是 把 
新 列表 添加 到 了 原 有 的 列表 里 面 ， 而 不 是 像 连 接 操作 那样 新 建 一 个 列表 。list.extend() 方 法 也 

被 用 来 做 复合 赋值 运算 ， 也 就 是 Python 2.0 中 添加 的 替换 连接 操作 (+=) 。 


必须 指出 ， 连 接 操作 符 并 不 能 实现 向 列表 中 添加 新 元 素 的 操作 。 在 接 下 来 的 例子 中 ， 我 们 展 
示 了 一 个 试图 用 连接 操作 向 列表 中 添加 新 元 素 而 报错 的 例子 。 


>>> num list + 'new item' 
Traceback (innermost last): 
File "«stdin»", line 1l, in ? 


TypeError: illegal argument type for built-in operation 


这 个 例子 之 所 以 是 错误 的 ， 是 因为 我 们 在 连接 操作 符 的 左右 两 边 使 用 了 不 同类 型 的 值 ， 列 表 
类 型 + 字符 串 类 型 这 样 的 操作 是 非法 的 。 显 然 ， 我 们 的 初 喜 是 把 一 个 字符 串 作 为 一 个 新 元 素 添 
加 到 列表 中 去 ， 不 过 我 们 的 方法 不 正确 。 幸 运 的 是 ， 我 们 有 一 个 正确 的 方法 : 


使 用 内 建 函 数 append() (我 们 会 在 6.13 节 里 面 正 式 地 介绍 append() 和 其 他 内 建 函数 ) 。 
>>> num list.append('new item') 


4. 重复 操作 符 (*) 


T me A 
需要 的 时 候 也 可 以 使 用 这 一 操作 。 


>>> num list * 2 


(43; -1.23, -2, 619000.0, 43, -1.23, -2, 619000.0] 
>>> 


>>> num list * 3 
(43, -1.23, -2, 619000.0, 43, -1.23, -2, 619000.0, 43, 
-1.23, -2, 619000.0] 


Python 2.0 起 ， 也 开始 支持 复合 赋值 运算 
Po 
>>> hr *- 30 


>>> My 


6.12.3 列表 类 型 操作 符 和 列表 解析 


其 实 Python 中 没有 专门 用 于 列表 类 型 的 操作 符 。 列 表 可 以 使 用 大 部 分 的 对 象 和 序列 类 型 的 操 
作 符 。 此 外 ， 列 表 类 型 有 属于 自己 的 方法 。 列 表 才 有 的 构建 一 一 列表 解析 。 这 种 方法 是 结合 
了 列表 的 方 括 纹 和 for 循 环 ， 在 逻辑 上 描述 要 创建 的 列表 的 内 容 。 我 们 在 第 八 章 讨论 列表 解 
析 ， 这 里 仅仅 向 本 章 其 他 地 方 所 做 的 那样 ， 展 示 一 个 简单 的 例子 : 

=>> [Ti * 2 Zor i in [8 -2, 5] ] 

[16, -4, 10] 

»»» [i for i in range(8) ifi $ 2 -- 0] 

[0, 2, 4, 6] 


6.13 ”内 建 函数 


6.13.1 标准 类 型 函数 


cmp() 


在 4.6.1 节 里 ， 我 们 通过 比较 数字 和 字符 串 介绍 了 内 建 cmp() 函 数 。 但 我 们 还 不 知道 cmp() 有 函数 
是 如 何 跟 其 他 的 比如 列表 和 元 组 类 型 合作 的 ， 这 些 类 型 不 仅 含 有 数字 和 字符 串 ， 而 且 还 有 列 
表 、 元 组 、 字 典 之 类 的 其 他 对 象 ， 甚 至 可 以 是 用 户 自 定义 的 对 象 。 这 种 情况 下 cmp() 函 数 是 如 
何 工作 的 呢 ? 


oy listli; last2 = [123; "yZ" jy L456; abe | 
>>> cmp (listi; list2) 

-1 

>>> 


»»» cmp(list2, listl) 


>>> list3 = list2 + [789] 
>>> list3 

(456, 'abc', 789] 

>>> 


>>> cmp(list2, list3) 


如 果 我 们 比较 的 是 两 个 同类 的 对 象 ， 比 较 操 作 是 非常 直观 的 。 比 如 数字 和 字符 串 ， 直 接 比 较 
它们 的 值 就 行 了 。 对 于 序列 类 型 ， 比 较 操 作 稍微 有 点 复杂 了 ， 但 是 方式 上 有 相似 Python 在 两 
个 对 象 基本 不 能 比较 的 时 候 尽量 做 出 公平 的 结果 ， 比 如 当 两 个 对 象 没 有 关系 时 或 者 两 种 类 型 
根本 就 没有 用 于 比较 的 函数 ， 这 时 Python 只 能 根据 “逻辑 "来 做 出 结论 。 


除了 这 种 极端 的 情况 之 外 ， 安 全 而 又 健全 的 比较 方法 是 ， 如 果 有 不 相等 的 情况 出 现 ， 比 较 操 
作 就 结束 。 这 种 算法 是 如 何 工作 的 呢 ? 像 我 们 前 面 简短 的 提 到 过 的 ， 列 表 的 元 素 是 可 以 无 限 
迭代 的 。 如 果 它 的 元 素 都 是 相同 类 型 ， 则 用 标准 的 比较 方法 来 作 比 较 。 否 则 ， 如 果 要 比较 的 
元 素 类 型 不 一 致 ， 就 像 我 们 前 面 提 到 过 的 那样 ， 如 果 比 较 的 对 象 不 一 致 ， 那 么 要 得 到 一 个 准 
确 的 或 者 说 绝对 的 比较 结果 就 有 些 冒 险 。 


当 我 们 比较 list1 和 list2 时 ，listl 和 list2 进 行 逐 项 比较 。 第 一 个 比较 操作 发 生 在 两 个 列表 的 第 一 个 
元 素 之 间 ， 比 如 说 ，123 跟 456 比 较 ， 因 为 123<456， 所 以 list1 被 认为 小 于 list2。 


如 果 比 较 的 值 相 等 ， 那 么 两 个 序列 的 下 一 个 值 继续 比较 ， 直 到 不 相等 的 情况 出 现 ， 或 者 到 达 
较 短 的 一 个 序列 的 末尾 。 在 这 种 情况 下 ， 长 的 序列 被 认为 是 " 较 大 ”的 。 这 就 是 为 什么 上 面 的 
list2<list3 的 原因 。 元 组 类 型 比较 也 是 用 这 种 算法 。 最 后 我 们 以 这 种 算法 的 关键 点 作为 本 节 的 
结束 。 


1. 对 两 个 列表 的 元 素 进行 比较 。 
2. 如 果 比 较 的 元 素 是 同类 型 的 ， 则 比较 其 值 ， 返 回 结果 。 
3. 如 果 两 个 元 素 不 是 同一 种 类 型 ， 则 检查 它们 是 否 是 数字 。 
a. 如 果 是 数字 ， 执 行 必要 的 数字 强制 类 型 转换 ， 然 后 比较 。 
b. 如 果 有 一 方 的 元 素 是 数字 ， 则 另 一 方 的 元 素 “ 大 ”( 数字 是 “最 小 的 ”) 
C. 否 则 ， 通 过 类 型 名 字 的 字母 顺序 进行 比较 。 
4. 如 果 有 一 个 列表 首先 到 达 末 尾 ， 则 另 一 个 长 一 点 的 列表 "大 ”。 
5. 如 果 我 们 用 尽 了 两 个 列表 的 元 素 而 且 所 有 元 素 都 是 相等 的 ， 那 么 结果 就 是 个 平局 ， 就 是 说 返 
回 一 个 0。 
6.13.2 ”序列 类 型 函数 
1. len() 


对 字符 串 来 说 len() 返 回 字符 串 的 长 度 ， 就 是 字符 串 包 含 的 字符 个 数 。 对 列表 或 者 元 组 来 说 ， 
它 会 像 你 想像 的 那样 返回 列表 或 者 元 组 的 元 素 个 数 ， 容 器 里 面 的 每 个 对 象 被 作为 一 个 项 来 处 
理 。 我 们 下 面 的 例子 用 了 上 面 已 经 定义 的 列表 。 


>>> lení(num list) 
4 
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>>> len (num list*2) 
8 


2. max() 和 min() 


max() 和 min() 函 数 在 字符 串 操 作 里 面 用 处 不 大 ， 因 为 它们 能 对 字符 串 做 的 只 能 是 找 出 字符 串 
中 “最 大 ”和 “最 小 ”的 字符 ( 按 词 典 序 ) ， 而 对 列表 和 元 组 来 说 ， 它 们 被 定义 了 更 多 的 用 处 。 比 
如 对 只 包含 数字 和 字符 串 对 象 的 列表 ，max() 和 min() 函 数 就 非常 有 用 ， 重 申 一 遍 ， 混 合 对 象 的 
结构 越 复 杂 返 回 的 结构 准确 性 就 越 差 。 然 而 ， 在 有 些 情况 下 (虽然 很 少 ) ， 这 样 的 操作 可 以 
返回 你 需要 的 结果 。 我 们 展示 了 一 些 使 用 上 面 定 义 好 的 列表 的 例子 。 


»»» max(str list) 

'park' 

>>> max (num list) 

[65535L, 2e*30, (76.45-1.33)] 
»»» min(str list) 
'candlestick' 

>>> min (num list) 

-49 


3. sorted()f»reversed() 


>>> Ss = ['They', 'stamp', 'them', 'when', "they're", 'small'] 
»»» for t in reversed(s): 
print t, 


small they're when them stamp They 

>>> sorted(í(s) 

['They', 'small', 'stamp', 'them', "they're", 'when'] 
初学 者 使 用 字符 串 ， 应 该 注意 如 何 把 单 引号 和 双 引 号 的 使 用 矛盾 和 谐 掉 ， 同 时 还 要 注意 字符 
串 排 序 使 用 的 是 字典 序 ， 而 不 是 字母 序 (字母 T' 的 ASCII| 码 值 要 比 字 母 'a' 的 还 要 靠 前 ) 


4. enumerate() 和 zip() 
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>>> albums = ['tales', 'robot', 'pyramid'] 
>>> for i, album in enumerate (albums): 
print i, album 


0 tales 
1l robot 
2 pyramid 
»»» 
>>> fn 
>>> ln 
>>> 
ER 

print ('$s $s' $ (i,j)).title() 


['*ián', 'stuart', 'david'] 
['bairnson', 'elliott', 'paton'] 


Ian Bairnson 
Stuart Elliott 
David Paton 


5. sum() 


2250 a w F5, 4d, 5) 

>>> reduce(operator.add, a) 
15 

>>> sum(a) 

15 


»»» sum(a, 5) 
20 
som.ag «c ELS diu. 92] 


>>> sum(a) 
i13. 


6. list()fetuple() 

list() AF tupe) £à Z4 TERIA (比如 另 一 个 序列 ) 作为 参数 ， 并 通过 浅 拷 贝 数据 来 创 
建 一 个 新 的 列表 或 者 元 组 。 虽 然 字 符 串 也 是 序列 类 型 的 ， 但 是 它们 并 不 是 经 常用 于 list() 和 
tuple()。 更 多 的 情况 下 ， 它 们 用 于 在 两 种 类 型 之 间 进 行 转换 ， 比 如 你 需要 把 一 个 已 有 的 元 组 转 
换 成 列表 类 型 的 (然后 你 就 可 以 修改 它 的 元 素 了 ) ， 或 者 相反 。 
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>>> aList = ['tao', 93, 99, 'time'] 

>>> aTuple = tuple(aList) 

>>> aList, aTuple 

(['*tao', 93, 99, 'time'], ('tao', 93, 99, 'time')) 


>>> aList -- aTuple 

False 

>>> anotherList = list(aTuple) 
>>> aList == anotherList 

True 


>>> aList is anotherList 

False 

>>> [id(x) for x in aList, aTuple, anotherList] 
[10903800, 11794448, 11721544] 


正如 我 们 在 本 章 的 开头 所 讨论 的 ， 无 论 list() 还 是 tuple() 都 不 可 能 做 完全 的 转换 ( 56.1.2 

P) 。 也 就 是 说 ， 你 传 给 tuple() 的 一 个 列表 对 象 不 可 能 变 成 一 个 元 组 ， 而 你 传 给 list() 的 对 象 也 
不 可 能 旧 正 的 变 成 一 个 列表 。 虽 然 前 后 两 个 对 象 (原来 的 和 新 的 对 象 ) 有 着 相同 的 数据 集合 
(所 以 相等 ==) ， 但 是 变量 指向 的 却 不 是 同一 个 对 象 了 (所 以 执行 is 操作 会 返回 false) 。 还 
要 注意 ， 即 使 它们 的 所 有 的 值 都 相同 ， 一 个 列表 也 不 可 能 “等 于 "一 个 元 组 。 


6.13.3 ”列表 类 型 内 建 函 数 


如 果 你 不 考虑 range() 函 数 的 话 ，Python 中 没有 特定 用 于 列表 的 内 建 函 数 。range() 函 数 接受 一 
个 数值 作为 输入 ， 输 出 一 个 符合 标准 的 列表 。 第 8 章 里 面 详细 讨论 了 range() 有 函数 。 列 表 类 型 对 
象 可 以 使 用 大 多 数 的 对 象 和 序列 的 内 建 函 数 ， 并 且 ， 列 表 对 象 有 属于 它们 自己 的 方法 。 


6.14 列表 类 型 的 内 建 函 数 


Python 中 的 列表 类 型 有 自己 的 方法 。 我 们 会 在 第 13 章 面向 对 象 编程 里 面 正 式 而 详细 的 介绍 方 
法 这 一 概念 ， 现 在 你 只 需要 把 方法 视 为 特定 对 象 的 函数 或 者 过 程 就 好 。 本 节 讨 论 的 方法 就 像 
内 建 的 函数 一 样 ， 除 了 它们 只 对 列表 类 型 进行 操作 之 外 。 因 为 这 些 函 数 涉 及 到 对 列表 更 改 
(或 者 说 更 新 ) ， 所 以 它们 都 不 适应 于 元 组 。 


你 可 以 重 温 一 下 我 们 前 面 讲 到 的 用 点 号 的 方式 访问 对 象 的 属性 object.attribute 列 表 的 方法 也 是 
这 样 : list.method()。 我 们 用 点 号 来 访问 一 个 对 象 的 属性 (在 这 里 是 一 个 函数 ) ， 然 后 用 函数 
操作 符 (()) 来 调用 这 个 方法 。 


我 们 可 以 在 一 个 列表 对 象 上 应 用 dir() 方 法 来 得 到 它 所 有 的 方法 和 属性 。 
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>>> dir(list) # or dir([]) 

(tO add. T, ' class ', T :contains. ', ':delsattr .', 
"ogelitem ', ' . gdelslloa. '", ' doo Hi ' eq .', 

'o dea ', ' gatattribute "ss ' .getitem -', 


— Y' 


T getsllQe. |; 10t t; Uo hgsh otur 1.4a09.-'. 


— ’ 


ME C. ^ dE C. X quay n, 5o S, U MS SOS 
oup 7. Mul T Weg cto ^ sew 6 *"— PadBcs T. 
' reduce ex .', ' repr ', 1 reversed ', ' rmul.', 


' Ssetattr ', ' setitem ', ' setslice ', ' str ', 
'append', 'count', 'extend', 'index', 'insert', 'pop', 
'remove', 'reverse', 'sort'] 


表 6.11 列 出 了 目前 列表 类 型 支持 的 所 有 方法 ， 稍 后 我 们 给 出 使 用 这 些 方法 的 例子 。 


表 6.11 列表 类 型 内 建 函 数 
NRAN 作 用 


list.append(obj) 
list.count(obj) 
list.extend(seq)* 
list.index(obj, i70, j-len(list)) 


向 列表 中 添加 一 个 对 象 obj 

返回 一 个 对 象 obj de Eden mtt 

把 序列 seq 的 内 容 渗 加 到 列表 中 

lis(k] = obj (F) k (E, JE IL k (P) REIR AE. mk) S UL XE ValucError 


list inserti index, obj) TEL OU index 的 位 置 插入 对 象 obj 
lisLpopindex 一 人 种 内 并 返 辐 捞 定 位 置 的 对 象 ， 默 认 是 最 后 一 个 对 象 
list.remove(obj) MPRP € obj 
list.reverse() Kutpu 


list.sort(func»None, key-None,reverse» False)" 以 托 定 的 方式 排序 列表 中 的 成 员 ， 如 果 func 和 key 参数 指定 ， 则 按照 


指定 的 方式 比较 各 个 元 义 ， 如 果 reverse 标志 被 加 为 True， 则 列表 以 反 
nmn 


a. Pythool.$2 加 入 的 特性 。 
b. key 和 reverse 符 性 在 Python24 中 加 入 。 


>>> music media = [45] 

>>> music media 

(45] 

>>> 

>>> music media.insert(0, 'compact disc') 

>>> music media 

['compact disc', 45] 

>>> 

>>> music media.append('long playing record') 
>>> music media 

['compact disc', 45, 'long playing record'] 
>>> 

>>> music media.insert(2, '8-track tape') 

>>> music media 

['compact disc', 45, '8-track tape', 'long playing record'] 
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在 前 面 的 例子 中 ， 我 们 用 一 个 元 素 初 始 化 了 一 个 列表 ， 然 后 当 向 列表 插入 元 素 ， 或 在 尾部 追 
加 新 的 元 素 后 ， 都 会 去 检查 这 个 列表 。 现 在 确认 一 下 一 个 值 是 否 在 我 们 的 列表 中 ， 并 看 看 如 
何 找 出 元 素 在 列表 中 的 索引 值 。 我 们 用 in 操作 符 和 index() 方 法 实现 这 两 个 需求 。 


>>> 'cassette' in music media 
False 
>>> 'compact disc' in music media 


True 


>>> music media.index(45) 
>>> music media.index('8-track tape') 


>>> music media.index('cassette') 
Traceback (innermost last): 
File "«interactive input»", line 0, in ? 


ValueError: list.index(x): x not in list 


噢 ! 最 后 一 个 例子 怎么 出 错 了 2? 96 Xe xIHindexQA4e 4& —4c0 X 6 4T — list? 3t 
不 是 个 好 主意 ， 因 为 我 们 出 错 了 。 应 该 先 用 in 成 员 关 系 操作 符 (或 者 是 not in) 检查 一 下 ， 然 
后 在 用 index() 找 到 这 个 元 素 的 位 置 。 我 们 可 以 把 最 后 几 个 对 index() 调 用 放 到 一 个 单独 的 for 循 
环 里 面 ， 像 这 样 : 


for eachMediaType in (45, '8-track tape', 'cassette'): 
if eachMediaType in music media: 


print music media.index(eachMediaType) 


这 个 方案 避免 了 我 们 上 面 犯 的 错误 ， 因 为 在 确认 一 个 元 素 属于 该 列表 之 前 index() 方 法 是 不 会 
被 调用 的 。 稍 后 我 们 将 会 发 现 该 如 何 处 理 这 种 错误 ， 而 不 是 这 样 的 一 出 错 ， 程 序 就 崩溃 了 。 


接 下 来 我 们 测试 sort() 和 reverse() 方 法 ， 它 们 会 把 列表 中 的 元 素 排序 ， 然 后 翻转 。 


>>> music media 

['compact disc', 45, '8-track tape', 'long playing record'] 
»»» music media.sort() 

»»» music media 

(45, '8-track tape', 'compact disc', 'long playing record'] 
>>> music media.reverse() 

>>> music media 


['long playing record', 'compact disc', '8-track tape', 45] 


核心 笔记 : 那些 可 以 改变 对 象 值 的 可 变 对 象 的 方法 是 没有 返回 值 的 
Python 初学 者 经 常会 陷入 一 个 误区 : 调用 一 个 方法 就 返回 一 个 值 。 最 明显 的 例子 就 是 sort()。 


>>> music media.sort() # 输出 哪 去 了 ? 


> > Fa 


在 使 用 可 变 对 象 的 方法 如 sort()、extend() 和 reverse() 的 时 候 要 注意 ， 这 些 操作 会 在 列表 中 原 
地 执行 操作 ， 也 就 是 说 现 有 的 列表 内 容 会 被 改变 ， 但 是 没有 返回 值 ! 是 的 ， 与 之 相反 ， 字 符 
串 方法 确实 有 返回 值 。 

>>> 'leanna, silly girl!'.upper() 


'LEANNA, SILLY GIRL!' 








温习 一 下 ， 字 符 串 是 不 可 变 所 可 变 对 象 的 方法 是 不 能 改变 它们 的 值 的 ， 所 以 它们 必须 
返回 一 个 新 的 对 象 。 ks AERE 回 一 个 对 象 ， 那 么 我 们 建议 你 看 一 下 Python2.4 以 后 加 
入 的 reversed() 和 sorted() 内 建 函 数 。 





它们 像 列 表 的 方法 一 样 工作 ， 不 同 的 是 它们 可 以 用 做 表达 式 ， 因 为 它们 返回 一 个 对 象 。 同 时 
原来 的 那个 列表 还 是 那个 列表 ， 没 有 改变 ， 而 你 得 到 的 是 一 个 新 的 对 象 。 


回 到 sort() 方 法 ， 它 默认 的 排序 算法 是 归并 排序 (或 者 说 imsort”") 的 衍生 暮 法， 时 间 复 杂 度 
ŽO (lg (n) ) 。 关 于 这 个 算法 我 们 不 做 进一步 的 讲解 ， 可 以 通过 源码 查看 它们 的 详情 
Objects/listobject.c， 还 有 算法 描述 : Objects/listsort.txt 。 





extend() 方 法 接受 一 个 列表 的 内 容 然后 把 它 的 所 有 元 素 追 加 到 另 一 个 列表 中 去 : 


w a /96 di al aud i D Aud 
mu media id (new media) 
~ medi 
nc 


从 2.2 开 始 ，extend() 方 法 的 参数 支持 任何 可 迭代 对 象 。 在 2.2 之 前 ， 它 的 参数 必须 是 序列 对 
象 ， 而 在 1.6 之 前 它 的 参数 必须 是 列表 对 象 。 通 过 可 近代 对 象 (而 不 是 一 个 序列 对 盘 ) ， 你 能 
做 更 多 有 趣 的 事情 ， 比 如 : 

>>> motd = [] 

>>> motd.append('MSG OF THE DAY') 

>>> f = open('/etc/motd', 'r') 

>>> motd.extend(f) 

>>> f.close() 

>>> motd 


['MSG OF THE DAY', 'Welcome to Darwin!Mn'] 


1. 5.2 中 加 入 的 pop() 方 法 会 从 列表 中 把 最 后 的 或 指定 的 元 素 返回 调用 者 。 我 们 会 在 6.15.1 节 和 
练习 中 看 到 pop() 方 法 。 


6.15 列表 的 特殊 特性 


用 列表 构建 其 他 数据 结构 


列表 有 容器 和 可 变 的 特性 ， 这 使 得 它 非常 灵活 ， 用 它 来 构建 其 他 的 数据 结构 不 是 件 难 事 。 我 
们 马上 能 想到 的 是 堆栈 和 队列 。 


1. ËR 


堆栈 是 一 个 后 进 先 出 (LIFO) 的 数据 结构 ， 其 工作 方式 就 像 自 助 餐厅 里 面 用 于 放 盘 子 的 弹簧 
支架 。 把 盘子 想像 成 对 象 ， 第 一 个 离开 堆栈 的 是 你 最 后 放 上 的 那个 。 在 栈 上 “push" 元 素 是 个 党 
用 术语 ， 意 思 是 把 一 个 对 象 添加 到 堆栈 中 。 反 之 ， 要 删除 一 个 元 素 ， 你 可 以 把 它 “pop” 出 堆 
栈 ， 例 6.3 展 示 了 一 个 菜单 驱动 的 程序 ， 它 实现 了 一 个 简单 的 、 用 于 存储 字符 串 的 堆栈 。 


逐 行 解释 
1-34 
一 开始 是 Unix 的 起 始 行 ， 然 后 我 们 初始 化 堆栈 (其实 是 个 列表 ) 。 


例 6.3 用 列表 模拟 堆栈 (stack.py) 


o x 
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这 个 简单 的 脚本 把 列表 作为 堆栈 用 于 存储 和 取 回 输入 的 字符 串 ， 这 个 菜单 驱动 的 程序 仅 使 用 
了 列表 的 append() 和 pop() 方 法 。 


1  $!/usr/bin/env python 


2 
3 stack = [] 
4 


5 dəf pushit(): 
6 stack.append(raw input(' Enter New string: ').strip()) 
3 
8 def popit (): 
9 if len (stack)**0: 
10 print 'Cannot pop from an empty stack!" 
11 else: 
12 print 'Removed [', "'stack.pop() ', ')J' 
13 
14 def viewstack(): 
15 print stack 4 calls str() internally 
16 
17 CMDs = ('u': pushit, 'o': popit, 'v': viewstack) 
18 
19 def showmenu(): 
20 ee 
21 p(U)sh 
22  p(O)p 
23 (V)iew 
24 (Q)uit 
25 
26 Enter choice: """ 
27 
28 while True: 
29 while True: 
30 try: 
31 choice = raw input(pr).strip( [0].lower() 
32 except (EOFError,KeyboardiInterrupt,IndexError): 
33 choice = 'q' 
34 
35 print 'MnYou picked: [$5]' % choice 
36 if choice not in 'uovq': 
37 print 'Invalid option, try again" 
38 else: 
39 break 
40 
41 if choice == 'q': 
42 break 
43 CMDs [choice] () 
44 
45 if name == ' main "': 
46 showmenu (] 
5-64 
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pushit() 函 数 添 加 一 个 元 素 (通过 提示 由 用 户 输 入 ) 到 堆栈 中 。 
8 ~ 12 行 


popit() 函 数 从 堆栈 中 移 除 一 个 元 素 〈 最 新 的 那个 ) 。 试 图 从 一 个 空 的 堆栈 中 移 除 元 素 会 引发 一 
个 错误 。 这 种 情况 下 ， 用 户 会 得 到 一 个 警告 提示 。 当 一 个 元 素 从 堆栈 中 pop 出 来 时 ， 用 户 可 以 
看 到 到 底 是 哪个 元 素 被 移 除了 。 我 们 用 反 单 引号 C) 来 代替 repr() 函 数 ， 把 字符 串 的 内 容 用 引 
号 括 起 来 显示 ， 而 不 是 单单 显示 字符 串 的 内 容 。 


14 ~ 15 行 
viewstack() 方 法 显示 堆栈 现 有 的 内 容 。 


4. 


7 行 


一 人 


虽然 我 们 下 一 章 才 会 正式 讲解 字典 类 型 ， 但 是 这 里 我 们 还 是 希望 给 你 展示 一 个 小 例子 ， 一 个 
包含 命令 的 矢量 (CMD) 。 这 个 字典 的 内 容 是 前 面 定义 的 三 个 "动作 "函数 ， 它 们 可 以 通过 字 
母 进行 访问 ， 用 户 必 须 输 入 这 些 字母 来 执行 相应 的 命令 。 比 如 说 ， 要 进 栈 一 个 字符 串 ， 用 户 
就 必须 输入 'U'， 那 么 字母 山 是 如 何 从 字典 里 面 访问 到 pushit() 函 数 的 呢 ? 在 第 43 行 执行 了 选择 
的 函数 。 


19 ~ 43 行 


整个 菜单 驱动 的 应 用 都 是 由 showmenu() 辑 数控 制 的 。 它 首先 向 用 户 提供 一 个 选单 ， 如 果 用 户 
输入 了 合法 选项 就 调用 相应 的 函数 。 我 们 还 没有 详细 地 涉及 到 异常 的 处 理 ，try-except 语 句 ， 
但 本 节 里 面 的 代码 允许 用 户 输 入 ^D (EOF， 产 生 一 个 EOF 错 误 ) RAC (中 断 退 出 ， 产 生 一 
个 Keyboardlnterrupt 异 常 ) ， 这 两 种 操作 在 我 们 的 脚本 里 面 都 会 得 到 处 理 ， 结 果 等 同 于 用 户 
输入 'q' 退 出 应 用 程序 。 这 是 对 Python 弄 常 处 理 特性 的 一 次 应 用 ， 说 明了 Python 的 异常 处 理 机 
制 是 多 么 方便 。 外 循环 用 来 执行 用 户 输 入 的 指令 直到 用 户 退 出 应 用 ， 内 循环 提示 用 户 输入 一 
个 合法 的 命令 项 。 


45 ~ 46 行 


如 果 调 用 文件 ， 这 部 分 的 代码 就 会 启动 程序 。 如 果 该 脚本 只 是 被 作为 一 个 模块 导入 ， 则 仅仅 
是 导入 定义 的 函数 和 变量 ， 而 菜单 也 就 不 会 显示 。 关 于 第 45 行 和 name 变量 ， 请 查阅 第 
3.4.1 节 。 


下 面 简单 的 执行 了 一 下 该 脚本 。 
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$ stack.py 


p(U)sh 
p(O)p 
(V) iew 
(Q)uit 
Enter choice: u 


You picked: [u] 
Enter new string: Python 
p(U)sh 


p(Oo)p 
(V)iew 
(Q)uit 


Enter choice: u 


You picked: [u] 
Enter new string: is 
p(U)sh 

p(o)p 

(V) iew 

(Q)uit 


Enter choice: u 


You picked: [u] 
Enter new string: cool! 
p(U)sh 


p(o)p 
(V) iew 
(Q)uit 


Enter choice: v 


You picked: [v] 
['Python', 'is', 'cool!'] 
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p (U) sh 

p(O)p 

(V)iew 

(Q)uit 

Enter choice: o 
You picked: [o] 
Removed [ 'cool!' | 
p(U)sh 

p(O)p 

(V)iew 

(Q)uit 

Enter choice: o 
You picked: [o] 
Removed [ 'is' 
p(U)sh 

p(o)p 

(V)iew 

(Q)uit 

Enter choice: o 
You picked: [o] 
Removed | 'Python' ] 
p(U)sh 

p(O)p 

(V)iew 

(Q)uit 


Enter choice: o 


You picked: [0] 
Cannot pop from an empty stack! 


p(U)sh 
p(o)p 
(V) iew 
(Q)uit 


Enter choice: ^D 


You picked: [q] 
2. 队列 


队列 是 一 种 先进 先 出 (FIFO) 的 数据 类 型 ， 它 的 工作 原理 类 似 于 超市 中 排队 交 钱 或 者 银行 里 
面 的 排队 ， 队 列 里 的 第 一 个 人 首先 接受 服务 (满心 想 第 一 个 出 去 ) 。 新 的 元 素 通过 “入 队 ” 的 方 
式 添加 进 队 列 的 末尾 ，" 出 队 ? 就 是 从 队列 的 头 部 删除 。 下 面 的 例子 里 面 展示 了 这 种 操作 ， 我 们 
把 上 面 的 堆栈 的 例子 进行 了 改造 ， 用 列表 实现 了 一 个 简单 的 队列 。 


例 6.4 把 列表 用 做 队列 (queue.py) 


这 个 例子 中 ， 我 们 把 列表 用 做 队列 来 存储 和 取 回 菜单 驱动 应 用 里 面 输入 的 字符 串 ， 只 用 到 了 
列表 的 append() 和 pop() 方 法 。 
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t!/usr/bin/env python 


queue = [] 


o) 4» Q0 MN H| 


def enQ(): 


queue.append(raw input(' Enter New string: ').strip()) 


6 
7 
8 def deQ(): 
9 if len(queue)--0: 


10 print 'Cannot pop from an empty queue!' 
11  elso: 

12 print 'Removed [', 'queue.pop(0)', ']' 
13 

14 def viewQ(): 

15 print queue 4 calls str() internally 
16 

17 CMDs = ('e': enQ, 'd': deQ, 'v': viewQ) 

18 

19 def showmenu(): 

20 pr=""" 


21 (E)nqueue 
22 (D)equeue 


23 (V)iew 
24 (Q)uit 
25 
26 Enter choice: """ 
27 
28 while True: 
29 while True: 
30 try: 
31 choice = raw input (pr) .strip() [0].lower() 
32 except (EOFError,KeyboardInterrupt,IndexError): 
33 choice = 'q' 
34 
35 print '\nYou picked: [$s]' $ choice 
36 if choice not in 'devq': 
37 print 'Invalid option, try again' 
38 else: 
39 break 
40 
41 if choice == 'q': 
42 break 
43 CMDs [choice] () 
44 
45 if name == ' main ': 
46 showmenu() 
乏 行 解释 


该 脚本 跟 上 面 的 stack.py 非 常 相 似 ， 所 以 我 们 只 讲解 一 下 有 显著 


1~7 行 
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同 的 行 。 


236 


定义 了 几 个 后 面 脚本 要 用 到 的 常量 。 
5 ~ 6 行 

enQ() 方 法 跟 pushit() 方 法 非常 相近 ， 只 不 过 名 字 改 变 了 。 
8 ~ 12 行 


两 个 脚本 的 主要 差别 就 在 于 此 ，deQ() 函 数 不 像 popit() 函 数 那样 把 列表 的 最 后 一 个 元 素 弹出 
来 ， 而 是 第 一 个 元 素 。 


17 ` 21 ~ 24、36 行 
选项 改变 了 ， 所 以 我 们 也 需要 重 写 原来 的 提示 信息 和 输入 检查 。 


还 是 在 这 里 列举 一 些 输出 。 


$ queue.py 

(E) nqueue 

(D)equeue 

(V) iew 

(Quit 

Enter choice: e 

You picked: [e] 

Enter new queue element: Bring out 
(E) nqueue 

(D) equeue 

(V) iew 

(Qruit 

Enter choice: e 

You picked: [e] 

Enter new queue element: your dead! 
(E) nqueue 

(D)equeue 

(V) iew 

(Q)uit 

Enter choice: v 

You picked: [v] 
['Bring out', 'your dead!" 
(E) nqueue 

(D) equeue 

(V) iew 

{Quit 

Enter choice: d 

You picked: [d] 
Removed [ 'Bring out’ ] 
(E) nqueue 

(D)equeue 

(V)iew 

(Q) uit 

Enter choice: d 

rou picked: [d] 


Removed | 'your dead!’ |] 


(E) nqueue 
(D) equeue 
(V) iew 
(Quit 


Enter choice: d 





You picked: [d] 

Cannot dequeue from empty queue! 
(E) nqueue 

(D) equeue 

(V)iew 

(Q) uit 

Enter choice: ^D 


You pícked: [q] 


6.16 元 组 


实际 上 元 组 是 跟 列表 非常 相近 的 另 一 种 容器 类 型 。 元 组 和 列表 看 起 来 不 同 的 一 点 是 元 组 用 的 
是 圆 括号 而 列表 用 的 是 方 括号 。 而 功能 上 ， 元 组 和 列表 相 比 有 一 个 很 重要 的 区 别 ， 元 组 是 一 
种 不 可 变 类 型 。 正 因为 这 个 原因 ， 元 组 能 做 一 些 列 表 不 能 做 的 事情 .………. 用 做 一 个 字典 的 key。 
另外 当 处 理 一 组 对 象 时 ， 这 个 组 默认 是 元 组 类 型 。 


通常 情况 下 ， 我 们 会 先 介 绍 可 用 于 大 部 分 对 象 的 操作 符 和 内 建 函 数 ， 然 后 是 介绍 针对 序列 类 
型 的 ， 最 后 是 总 结 一 下 仅 适 用 于 元 组 类 型 的 操作 符 和 内 建 函 数 。 不 过 ， 由 于 元 组 类 型 跟 列 表 
类 型 有 着 如 此 多 的 共同 之 处 ， 按 照 这 种 讲法 我 们 会 重复 非常 多 的 上 一 节 的 内 容 。 为 了 避免 太 
多 重复 信息 ， 我 们 会 讲解 元 组 和 列表 在 应 用 于 每 一 组 操作 符 和 内 建 函 数 上 时 的 区 别 ， 然 后 讨 
论 一 下 元 组 的 不 变性 和 其 他 的 特性 。 

1. 如 何 创 建 一 个 元 组 并 给 它 赋值 

创建 一 个 元 组 并 给 他 赋值 实际 上 跟 创 建 一 个 列表 并 给 它 赋 值 完全 一 样 ， 除 了 一 点 ， 只 有 一 个 
元 素 的 元 组 需要 在 元 组 分 割 符 里 面 加 一 个 过 号 (，) 以 防止 跟 普通 的 分 组 操作 符 混淆 。 不 要 
忘 了 它 是 一 个 工厂 方法 ! 


>>> aTuple = (123, 'abc', 4.56, ['inner', 'tuple'], 7-91) 


>>> anotherTuple = (None, 'something to see here') 


>>> print aTuple 


(123, 'abc', 4.56, ['inner', 'tuple'], (7-93)) 
>>> print anotherTuple 
(None, 'something to see here') 
»»» emptiestPossibleTuple = (None,) 
^ print emptiestPossibleTuple 


> tuple('bar') 


a af, Ust 
2. 如 何 访问 元 组 中 的 值 
元 组 的 切片 操作 跟 列表 一 样 ， 用 方 括号 作为 切片 操 符 (上) ， 里 面 写 上 索引 值 或 者 索引 范围 。 
»»» aTuple[1:4] 
('abc', 4.56, ['inner', 'tuple']) 
»»» aTuple[:3] 


(123, 'abc', 4.56) 
»»» aTuple[3][1] 





'tuple' 


3. 如 何 更 新 元 组 

跟 数 字 和 字符 串 一 样 ， 元 组 也 是 不 可 变 类 型 ， 就 是 说 你 不 能 更 新 或 者 改变 元 组 的 元 素 。 在 6.2 
DD E E E E E 
需要 这 样 。 


>>> aTuple = aTuple[0], aTuple[1], aTuple[-1] 
>>> aTuple 

(123, 'abc', (7-93)) 

>>> tupl = (12, 34.56) 

»»» tup2 = ('abc', 'xyz"') 


>>> tup3 = tupl + tup2 


>>> tup3 
(Er 34,950, "ADE; "'"xyz") 


4. 如 何 移 除 一 个 元 组 的 元 素 以 及 元 组 (本 身 ) 


删除 一 个 单独 的 元 组 元 素 是 不 可 能 的 。 当 然 ， 把 不 需要 的 元 素 丢弃 后 ， 重 新 组 成 一 个 元 组 是 
没有 问题 的 。 


要 显示 地 删除 一 整个 元 组 ， 只 要 用 del 语 句 减少 对 输 引 用 计数 。 当 这 个 引用 计数 达到 0 的 时 候 ， 
该 对 象 就 会 被 析 构 。 记 住 ， 大 多 数 时 候 ， 我 们 不 需要 显 式 的 用 del 删 除 一 个 对 象 ， 一 出 它 的 作 
用 域 它 就 会 被 析 构 ，Python 编 程 里 面 用 到 显 式 删 除 元 组 的 情况 非常 之 少 。 


del aTuple 


6.17 元 组 操作 符 和 内 建 函 数 


6.17.1 标准 类 型 操作 符 、 序 列 类 型 操作 符 和 内 建 函 数 


元 组 的 对 象 和 序列 类 型 操作 符 和 内 建 函 数 跟 列表 的 完全 一 样 。 你 仍然 可 以 对 元 组 进行 切片 
作 、 合 并 操作 ， 以 及 多 次 找 贝 一 个 元 组 ， 还 可 以 检查 一 个 对 象 是 否 属于 一 个 元 组 ， 进 行 元 
之 间 的 比较 等 。 


e 
B $ 


1. 创建、 重复、 连接 操作 
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>>> t - (['xyz', 123), 23, -103.4) 

»»»t 

(['*xyz', 123], 23, -103.4) 

»»t*2 

([*xyz', 123], 23, -103.4, ['xyz', 1231, 23, -103.4) 
»»» t7 t * ('free', 'easy"') 

»»»t 

(['xyz', 123], 23, -103.4, 'free', "easy") 


2. 成员 关系 操作 、 切 片 操 作 


PO 29 MAL 


True 

2»» I23 Am t 
False 

>>> [和 二] 
123 

2S5» t[Ils] 


(23, -103,4, "'free', "'easy') 


3. AZAA 


»»» str(t) 

(['ayz', 123], 23, -103.4, *freeé', "'easy") 

>>> len(t) 

5 

2»» max(t) 

'free' 

>>> min(t) 

-103.4 

>>>. cmp(t, (['xyz', 123], 23, -103.4, 'free', 'easy"')) 
0 


>>> list (t) 
[['xvz', 123], 23, -103.4, 'free', "'easy'] 


4. 操 作 符 
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»»» (4, 2) «€ (3; 5] 
False 

5» (or 43 v (2, 1) 
True 

>>> (2, 4) == (3, -1) 
False 

»»» (2, 4) == (2, 4) 


True 


6.17.2. 元 组 类 型 操作 符 和 内 建 函 数 、 内 建 方法 


像 列表 一 样 ， 元 组 也 没有 它 自己 专用 的 操作 符 和 内 建 函 数 。 上 一 节 中 描述 的 列表 方法 都 跟 列 
表 对 象 的 可 变性 有 关 ， 比 如 说 排序 、 蔡 换 、 添 加 等 ， 因 为 元 组 是 不 可 变 的 ， 所 以 这 些 操作 对 
元 组 来 说 就 是 多 余 的 ， 这 些 方法 没有 被 实现 


6.18 元 组 的 特殊 特性 


6.18.1 不 可 变性 给 元 组 带 玉 了 什么 影 " 


是 的 ， 我 们 在 好 多 地 方 使 用 到 了 “不 可 变性 "这 个 单词 ， 除 了 这 个 词 的 计算 机 学 科 定 义 和 实 现 ， 
从 应 用 的 角度 来 考虑 ， 这 个 词 的 底线 是 什么 ?一 个 数据 类 型 成 为 不 可 变 的 到 底 意味 着 什么 ? 


在 3 个 标准 不 可 变 类 型 里 面 一 一 数字 、 字 符 囊 和 元 组 字符 串 一 一 元 组 是 受到 影响 最 大 的 ， 一 个 
数据 类 型 是 不 可 变 的 ， 简 单 来 讲 ， 就 意味 着 一 旦 一 个 对 象 被 定义 了 ， 它 的 值 就 不 能 再 被 更 

新 ， 除 非 重新 创 M e 。 对 数字 和 字符 串 的 影响 不 是 很 大 ， 因 为 它们 是 标量 类 型 ， 

当 它 们 代表 的 值 改变 时 ， 这 种 结果 是 有 意义 的 ， 是 按照 你 所 想 要 的 方式 进行 访问 的 。 而 对 于 
元 组 ， 事 情 就 不 是 这 a o 


因为 元 组 是 容器 对 象 ， 很 多 时 候 你 想 改变 各 
这 是 不 可 能 的 ， 切 片 操 作 符 不 能 用 作 堪 值 ; 
用 于 只 读 的 操作 。 


R x 
Com 
z 
d 
E 
o 


eo ded 一 个 或 者 多 个 元 素 。 不 幸 的 是 
这 和 字符 串 没 什么 不 同 ， 切片 操作 只 能 AG 


不 可 变 并 不 是 坏事 ， 比 如 我 们 把 数据 传 给 一 个 不 ， 可 以 确保 我 们 的 数据 不 会 被 修 
改 。 同 样 地 ， 如 果 我 们 操作 从 一 个 函数 返回 的 元 组 ， 可 以 通过 内 建 list() 函 数 把 它 转 换 成 一 个 列 
表 o 


6.18.2. 元 组 也 不 是 那么 “不 可 变 ” 


可 变 的 ， 但 这 并 不 影响 它 的 灵活 性 。 元 组 并 不 像 我 们 想 的 那么 不 可 
实 元 组 几 个 特定 的 行为 让 它 看 起 来 并 不 像 我 们 先前 声称 的 那么 不 可 


比如 说 ， 既 然 我 们 可 以 把 字符 囊 组 合 在 一 起 形成 一 个 大 字符 事 。 那 么 把 元 组 组 合 在 一 起 形成 
一 个 大 的 元 组 也 没什么 不 对 。 所 以 ， 连 接 操 作 可 用 ， 这 个 操作 一 点 都 没有 改变 那些 小 元 组 。 
我 们 所 作 的 是 把 它们 的 元 素 结合 在 一 起 。 这 里 有 几 个 例子 。 


>>> SS = '"first' 
>>> g= S + ' second' 
>>> S 


'first second' 


>>> 

>>> t = ('third', 'fourth') 
sm t 
('*third', '"fourth") 
5»» 


25» E =t + ('fIIUCh', "'"alxth') 
»»»t 


('third', fourth", “LAECH; "'sixth") 


同样 的 概念 也 适用 于 重复 操作 。 重 复 操作 只 不 过 是 多 次 复制 同样 的 元 素 。 再 有 ， 我 们 前 面 提 
de ame tas E 
会 吓 到 你 。 你 可 以 “修改 "特定 的 元 组 元 素 ， 哇 ! 这 意味 着 什么 


虽然 元 组 对 象 本 身 是 不 可 变 的 ， 但 这 并 不 意味 着 元 组 包含 的 可 变 对 象 也 不 可 变 了 。 


22» b = CL 123], 23, —-103.4) 

> > £ 

(3) 

»»» t[0][1] 

123 

>>% t[0][1] = ['abc', 'def£'] 

»»» E 

(['xzyz', ['abc', 'def']]), 23, 103.4) 


在 上 面 的 例子 中 ， 虽 然 t 是 一 个 元 组 类 型 变量 ， 但 是 我 们 设法 通过 替换 它 的 第 一 个 元 素 (一 个 
列表 对 象 ) 的 项 来 “改变 "了 它 。 我 们 替换 了 t[0][1]， 原 来 是 个 整 型 ， 我 们 把 它 替 换 成 了 一 个 列 
表 对 象 [abc'…，'def]。 虽 然 我 们 只 是 改变 了 一 个 可 变 对 象 ， 但 在 某 种 意义 上 讲 ， 我 们 也 " 改 

变 ”" 了 我 们 的 元 组 类 型 变量 。 


6.18.3 ”默认 集合 类 型 


所 有 的 多 对 象 的 、 吉 号 分 隔 的 、 没 有 明确 用 符号 定义 的 (上 比如 用 方 括号 表示 列表 和 用 圆 括 号 
表示 元 组 ) ， 这 些 集合 默认 的 类 型 都 是 元 组 。 下 面 是 一 个 简单 的 示例 。 


>>> 'abc', -4.24e93, 18-*6.6j, 'xyz' 
('abc', -4.24e«093, (1846.63), 'xyz') 
>>> 


So a a w T 2 
>>> 34 y 
(1, 2) 


1 A (不 包括 有 符号 封装 的 ) 都 是 元 组 类 型 。 注 意 ， 有 符号 封装 的 多 对 象 
集合 其 实 是 返回 的 一 个 单一 的 容器 对 象 ， 比 如 : 


def fool(): 


return objl, obj2, obj3 
def foo2(): 


return [objl, obj2, obj3] 
def foo3(): 


return (objl, obj2, obj3) 
上 面 的 例子 中 ，fool() 返 回 3 个 对 象 ， 默 认 的 作为 一 个 3 元 组 类 型 ; foo2() 返 回 一 个 单一 对 象 ， 
一 个 包含 3 个 对 象 的 列表 ; foo3() 返 回 一 个 跟 fool() 相 同 的 对 象 。 唯 一 不 同 的 是 这 里 的 元 组 是 显 
式 定义 的 。 
为 了 避免 令 人 讨厌 的 副作用 ， 建 议 总 是 显 式 地 用 圆 括号 表达 式 表示 元 组 或 者 创建 元 组 。 
On 
(4, True, 5) 


2005 (4. Z2) « (3, 3) 
False 


# tuple comparison 
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元 组 就 会 得 到 希望 得 到 的 结果 。 


6.18.4 单元 素 元 组 


曾经 试 过 创建 一 个 只 有 一 个 元 素 的 元 组 ?3 你 在 列表 上 试 过 ， 它 可 以 完成 ， 但 是 无 论 你 怎么 在 
元 组 上 试验 ， 都 不 能 得 到 想 要 的 结果 。 


>>> ['abc'] 

['abc'] 

>>> type(['abc']) # a list 

«type 'list'» 

>>> 

»»» ('xyz') 

' xyz' 

>>> type(('xyz')) # a string, not a tuple 
«type 'str'» 


或 许 你 忘记 了 圆 括号 被 重 载 了 ， 它 也 被 用 作 分 组 操作 符 。 由 圆 括号 包 衷 的 一 个 单一 元 素 首先 
被 作为 分 组 操作 ， 而 不 是 作为 元 组 的 分 界 符 。 一 个 变通 的 方法 是 在 第 一 个 元 素 后 面 添 一 个 去 
号 (，) 来 表明 这 是 一 个 元 组 而 不 是 在 做 分 组 操作 。 


>>> ('XyZ',) 
("XyZz',) 


6.18.5 字典 的 关键 字 


不 可 变 对 象 的 值 是 不 可 改变 的 。 这 就 意味 着 它们 通过 hash 算 法 得 到 的 值 总 是 一 个 值 。 这 是 作 
为 字典 键 值 的 一 个 必 备 条 件 。 在 下 一 章节 里 面 我 们 会 讨论 到 ， 键 值 必 须 是 可 “hash" 的 对 象 ， 元 
组 变量 符合 这 个 标准 ， 而 列表 变量 就 不 行 。 


核心 笔记 : 列表 VS. 元 组 


一 个 经 常会 被 问 到 的 问题 是 ，“ 为 什么 我 们 要 区 分 元 组 和 列表 变量 ? "这 个 问题 也 可 以 被 表述 
为 “我 们 真 的 需要 两 个 相似 的 序列 类 型 吗 ? ”， 一 个 原因 是 在 有 些 情况 下 ， 使 用 其 中 的 一 种 类 型 
要 优 于 使 用 另 一 种 类 型 。 

最 好 使 用 不 可 变 类 型 变量 的 一 个 情况 是 ， 如 果 你 在 维护 一 些 敏感 的 数据 ， 并 且 需 要 把 这 些 数 


据 传 递 给 一 个 并 不 了 解 的 函数 〈 或 许 是 一 个 根本 不 是 你 写 的 API) ， 作 为 一 个 只 负责 一 个 软件 
某 一 部 分 的 工程 师 ， 如 果 你 确信 你 的 数据 不 会 被 调用 的 函数 自 改 ， 你 会 觉得 安全 了 许多 。 


一 个 需要 可 变 类 型 参数 的 例子 是 ， 在 管理 动态 数据 集合 时 。 你 需要 先 把 它们 创建 出 来 ， 逐 渐 
地 或 者 不 定期 地 添加 它们 ， 或 者 有 时 还 要 移 除 一 些 单个 的 元 素 。 这 是 一 个 必须 使 用 可 变 类 型 
对 象 的 典型 例子 。 幸 运 的 是 ， 通 过 内 建 的 list(0) 和 tuple() 转 换 函 数 ， 你 可 以 非常 轻松 地 在 两 者 之 
间 进 行 转换 。 


list() 和 tuple() 远 数 允 许 你 用 一 个 列表 来 创建 一 个 元 组 ， 反 之 亦 然 。 如 果 你 有 一 个 元 组 变量 ， 但 
你 需要 一 个 列表 变量 ， 因 为 你 要 更 新 一 下 它 的 对 象 ， 这 时 list() 函 数 就 是 你 最 好 的 帮手 。 如 果 你 
有 一 个 列表 变量 ， 并 且 想 把 它 传 递 给 一 个 函数 ， 或 许 一 个 API， 而 你 又 不 想 让 任何 人 和 弄 乱 你 的 
数据 ， 这 时 tuple() 有 函数 就 非常 有 用 。 


6.19 相关 模块 


表 6.12 列 出 了 与 序列 类 型 相关 的 关键 模块 ， 这 个 列表 包含 了 前 面 我 们 间接 提 到 的 数组 模块 ， 
它 就 像 列表 类 型 ， 不 过 它 要 求 所 有 的 元 素 都 是 同一 类 型 。copy 模 块 (可 以 参考 下 面 的 6.20 
Y) 负责 处 理 对 象 的 浅 拷贝 和 深 找 贝 。 
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a. Python 2.3 新 加 


b. Python 24 新 和 


operator 模 块 除 了 提供 与 数字 操作 符 相 同 的 功能 外 ， 还 提供 了 与 序列 类 型 操作 符 相 同 的 功能 。 
types 模 块 是 代表 python 支 持 的 全 部 类 型 的 type 对 象 的 引用 。 最 后 ，UserList 模 块 包含 了 list 对 
象 的 完全 的 类 实现 。 因 为 Python 类 型 不 能 作为 子 类 ， 所 以 这 个 模块 允许 用 户 获得 类 似 list 的 

类 ， 也 可 以 派生 出 新 的 类 或 功能 。 如 果 你 熟悉 面向 对 象 编 程 的 话 ， 我 们 强烈 推荐 你 阅读 第 13 
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在 前 面 的 3.5 节 里 面 我 们 讲 过 ， 对 象 赋值 实际 上 是 简单 的 对 象 引 用 。 也 就 是 说 ， 当 你 创建 一 个 
对 象 ， 然 后 把 它 赋 给 另 一 个 变量 的 时 候 ，Python 并 没有 拷贝 这 个 对 象 ， 而 是 找 贝 了 这 个 对 象 
的 引用 。 


比如 ， 假 设 你 想 创建 一 对 小 夫妻 的 通用 档案 ， 名 为 person。 然 后 你 分 别 为 他 俩 拷贝 一 份 。 在 
下 面 的 例子 中 ， 我 们 展示 了 两 种 找 贝 对 象 的 方式 ， 一 种 使 用 了 切片 操作 ， 另 一 种 用 了 工厂 方 
法 ， 为 了 区 分 出 3 个 不 同 的 对 象 ， 我 们 使 用 id() 内 建 函 数 来 显示 每 个 对 象 的 标识 符 。 (我 们 还 
可 以 用 is 操作 符 来 做 相同 的 事情 ) 。 


>>> person = ['name', ['savings', 100.00]] 
»»» hubby = person[:] # slice copy 
>>> wifey = list(person) $ fac func copy 


»»» [id(x) for x in person, hubby, wifey] 


(11826320, 12223552, 11850936] 


为 他 们 创建 了 初始 有 $100 的 个 人 存款 账户 ， 用 户 名 改 为 定制 的 名 字 。 但 是 ， 当 丈夫 取 走 $50 
后 ， 他 的 行为 影响 到 了 他 妻子 的 账户 ， 虽 然 我 们 进行 了 分 开 的 拷贝 操作 ( 当然 ， 前 提 是 我 们 
希望 他 们 每 个 人 都 拥有 自己 单独 的 账号 ， 而 不 是 一 个 单一 的 联合 帐号。) 为 什么 会 这 样 呢 ? 


»»» hubby[0] = 'joe' 
>>> wifey[0] = 'jane' 
>>> hubby, wifey 
(['joe', ['savings', 100.0]], ['jane', ['savings', 100.0]]) 
>>> hubby[1][1] = 50.00 

>>> hubby, wifey 


(['3oe', ['savings', 50.0]], ['jane', ['savings', 50.0]]) 


原因 是 我 们 仅仅 做 了 一 个 浅 找 贝 。 对 一 个 对 象 进行 浅 找 贝 其 实 是 新 创建 了 一 个 类 型 跟 原 对 象 
一 样 ， 其 内 容 是 原来 对 象 元 素 的 引用 ， 换 句 话 说 ， 这 个 拷贝 的 对 象 本 身 是 新 的 ， 但 是 它 的 内 
容 不 是 。 序 列 类 型 对 象 的 浅 拷 贝 是 默认 类 型 拷贝 ， 并 可 以 以 下 几 种 方式 实施 (1) 完全 切片 操 
作 [:]; (2) 利用 工厂 函数 ， 比 如 list()、dict() 等 ; (3) 使 用 copy 模 块 的 copy 子 数 。 


你 的 下 一 个 问题 可 能 是 ， 当 妻子 的 名 字 被 赋值 ， 为 什么 丈夫 的 名 字 没有 受到 影响 ? 难道 它们 
的 名 字 现 在 不 应 该 都 是 Jane' 了 吗 ? 为 什么 名 字 没 有 变 成 一 样 的 呢 ? 怎么 会 是 这 样 呢 ? 这 是 因 
为 在 这 两 个 列表 的 两 个 对 象 中 。 第 1 个 对 象 是 不 可 变 的 〈 是 个 字符 串 类 型 ) ， 而 第 2 个 是 可 变 
的 (一 个 列表 ) 。 正 因为 如 此 ， 当 进行 浅 拷贝 时 ， 字 符 囊 被 显 式 的 拷贝 ， 并 新 创建 了 一 个 字 
符 串 对 象 ， 而 列表 元 素 只 是 把 它 的 引用 复制 了 一 下 ， 并 不 是 它 的 成 员 。 所 以 改变 名 字 没 有 任 
何 问题 ， 但 是 更 改 他 们 银行 账号 的 任何 信息 都 会 引发 问题 。 现 在 ， 让 我 们 分 别 看 一 下 每 个 列 
表 的 元 素 的 对 象 ID 值 。 注 意 ， 银 行 账号 对 象 是 同一 个 对 象 ， 这 也 是 为 什么 对 一 个 对 象 进行 修 
改 会 影响 到 另 一 个 的 原因 。 注 意 在 我 们 改变 他 们 的 名 字 后 ， 新 的 名 字 字 符 串 是 如 何 替换 原 
有 ' 名 字 ' 字 符 串 的 。 


改变 前 
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>>> [id(x) for x in hubby] 
[9919616, 11826320] 
>>> [id(x) for x in wifey] 
[9919616, 11826320] 


改变 后 


>>> [id(x) for x in hubby] 
[12092832, 11826320] 
>>> [id(x) for x in wifey) 
(12191712, 11826320] 


假设 我 们 要 给 这 对 夫妻 创建 一 个 联合 账户 ， 那 这 是 一 个 非常 棒 的 方案 。 但 是 ， 如 果 需 要 的 是 
两 个 分 离 账户 ， 就 需要 作 些 改动 了 。 要 得 到 一 个 完全 拷贝 或 者 说 深 找 贝 一 -创建 一 个 新 的 容 
器 对 象 ， 包 含 原 有 对 象 元 素 (引用 ) 全 新 拷贝 的 引用 一 需要 copy.deepcopy() 函 数 。 我 们 使 
用 深 找 贝 来 重 写 整 个 例子 。 


>>> person ” ['name', ['savings', 100.00]] 
>>> hubby = person 

»»» import copy 

>>> wifey = copy.deepcopy (person) 

>>> [id(x) for x in person, hubby, wifey] 
(12242056, 12242056, 12224232) 

>>> hubby[0] = 'joe' 

>>> wifey[0] = 'jane' 

>>> hubby, wifey 


(['3oe*, ['savings', 100.0]], ['jane', ['savings', 100.0]]) 


>>> hubby[1][(1] = 50.00 
»»» hubby, wifey 
(['joe', ['savings', 50.0]], ['jane', ['savings', 100.0]]) 


这 就 是 我 们 想 要 的 方式 。 作 为 验证 ， 让 我 们 确认 一 下 所 有 四 个 对 象 都 是 不 同 的 。 


»»» [id(x) for x in hubby] 
(12191712, 11826280] 
»»» [id(x) for x in wifey] 
(12114080, 12224792] 
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以 下 有 几 点 关于 拷贝 操作 的 警告 。 第 一 ， 非 容器 类 型 (比如 数字 、 字 符 串 和 其 他 "原子 "类 型 的 
ES t T 
的 。 第 二 ， 如 果 元 组 变量 只 包含 原子 类 型 对 象 ， 对 它 的 深 拷贝 将 不 会 进行 。 如 果 我 们 把 账户 
信息 改 成 元 组 类 型 ， 那 么 即便 按 我 们 的 要 求 使 用 深 堵 贝 操作 也 只 能 得 到 一 个 浅 拷 贝 。 


>>> person = ['name', ('savings', 100.00)] 
>>> newPerson = copy.deepcopy (person) 

»»» [id(x) for x in person, newPerson] 
[12225352, 12226112] 

»»» [id(x) for x in person] 

[9919616, 11800088] 

»»» [id(x) for x in newPerson] 


[9919616, 11800088] 


o9 





核心 模块 : copy 


我 们 刚才 描述 的 浅 找 贝 和 深 找 贝 操作 都 可 以 在 copy 模 块 中 找到 。 其 实 copy 模 块 中 只 有 两 个 函 
数 可 用 : copy() 进 行 浅 拷贝 操作 ， 而 deepcopy() 进 行 深 找 贝 操作 。 


6.21 友 列 类 型 小 结 


序列 类 型 为 数据 的 顺序 存储 提供 了 几 种 机 制 。 字 符 串 是 最 常用 的 数据 载体 ， 无 论 是 用 于 给 
户 显示 、 存 贮 到 硬盘 、 通 过 网 络 传输 还 是 作为 一 个 多 源 信 息 的 容器 。 列 表 和 元 组 提供 了 容器 
存储 能 力 ， 允 许 简 单 的 操作 和 访问 多 个 对 象 ， 无 论 它们 是 Python 的 对 象 还 是 用 户 à 定义 的 对 
象 。 单 一 元 素 或 一 组 元 素 可 以 通过 持续 有 序 地 索引 偏 移 进行 切片 操作 来 访问 。 总 之 ， 这 些 数 
据 类 型 为 你 的 Python 开发 环境 提供 了 灵活 而 易 用 的 存 贮 工具 。 我 们 RD eR 的 
操作 符 、 内 建 函 数 和 方法 的 摘要 列表 来 总 结 本 章 。 


表 6.13 序列 类 型 操作 符 、 内 建 函 数 和 方法 
换 作 符 、 内 建 函 数 或 方法 rap 
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续 表 
操作 符 、 内 建 函 数 或 方法 
startswith() 


4 
3 
e 


sur() 
strip) 


1 


6.22 练习 
6-1. 字 符 串 。string 模 块 中 是 否 有 一 种 字符 串 方法 或 者 函数 可 以 帮 我 鉴定 下 一 个 字符 串 是 
否 是 另 一 个 大 字符 囊 的 一 部 分 ? 


6-2. 字 符 串 标识 符 。 修 改 例 6-1 的 idcheck.py 脚 本 ， 使 之 可 以 检测 长 度 为 一 的 标识 符 ， 并 
且 可 以 识别 Python 关 键 字 。 对 后 一 个 要 求 ， 你 可 以 使 用 keyword 模 块 (特别 是 
keyword.kelist) 来 辅助 。 


6-3. 排 序 
(a) 输入 一 串 数 字 、 并 从 大 到 小 排列 之 。 
(b) 跟 a 一 样 。 不 过 要 用 字典 序 从 大 到 小 排列 。 


6-4. 算 术 。 更 新 上 一 草 里 面 你 的 得 分 测试 练习 方案 ， 把 测试 得 分 放 到 一 个 列表 中 去 。 你 的 
代码 应 该 可 以 计算 出 一 个 平均 分 ， 见 练习 2-9 和 练习 5-3。 


6-5. 字 符 串 


< 一 
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(a) 更 新 你 在 练习 2-7 里 面 的 方案 ， 使 之 可 以 每 次 向 前 向 后 都 显示 一 个 字符 串 的 一 
个 字符 。 


(b) 通过 扫描 来 判断 两 个 字符 串 是 否 匹 配 (不 能 使 用 比较 操作 符 或 者 cmp() 内 建 函 
数 ) 。 


附加 题 : 在 你 的 方案 里 加 入 大 小 写 区 分 。 


(c) 判断 一 个 字符 囊 是 否 重 现 (后 面 跟前 面 的 一 致 ) 。 附 加 题 : 在 处 理 除 了 严格 的 
回 文 之 外 ， 加 入 对 例如 控制 符号 和 空格 的 支持 。 


(d) 接受 一 个 字符 ， 在 其 后 面 加 一 个 反 向 的 拷贝 ， 构 成 一 个 回 文字 符 串 。 


6-6. 字 符 串 。 创 建 一 个 string.strip() 的 替代 函数 : 接受 一 个 字符 串 ， 去 掉 它 前 面 和 后 面 的 
空格 (如 果 使 用 string.*strip() 函 数 那 本 练习 就 没有 意义 了 ) 


6-7. 调 试 。 看 一 下 在 例 6.5 中 给 出 的 代码 (buggy.py) 


(a) 研究 这 段 代 码 并 描述 这 段 代码 想 做 什么 。 在 所 有 的 (H) 处 都 要 填写 你 的 注 


(b) 这 个 程序 有 一 个 很 大 的 问题 ， 比 如 输入 6、12、20、30、 等 它 会 死 挤 。 实 际 上 
它 不 能 处 理 任何 的 偶数 ， 找 出 原因 。 


(c) 修正 (b) 中 提出 的 问题 。 


6-8. 列 表 。 给 出 一 个 整 型 值 ， 返 回 代 表 该 值 的 英文 ， 比 如 输入 89 返 回 “eight-nine”。 附 加 
题 : 能 够 返回 符合 英文 语法 规则 的 形式 ， 比 如 输入 “89” 返 回 “eighty-nine”。 本 练习 中 的 值 
限定 在 0~1000。 


6-9. 转 换 。 为 练习 5-13 写 一 个 姊妹 函数 ， 接 受 分 钟 数 ， 返 回 小 时 数 和 分 钟 数 。 总 时 间 不 
变 ， 并 且 要 求 小 时 数 尽 可 能 大 。 


6-10. 字 符 串 。 写 一 个 函数 ， 返 回 一 个 跟 输 入 字符 串 相似 的 字符 串 ， 要 求 字 符 串 的 大 小 写 
反 转 。 比 如， 输入 "Mr.Ed”， 应 该 返回 "mR.eD" 作 为 输出 。 


例 6.5 有 bug 的 程序 (buggypy) 


这 是 一 个 用 于 练习 6-7 的 程序 ， 判 断 这 个 程序 是 干什么 的 ， 在 “#" 处 添加 你 的 注释 ， 找 
出 其 中 的 错误 ， 并 修改 之 。 
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#!/usr/bin/env python 


num str = raw input('Enter a number: ') 


EH 
num num - int(num str) 


4 


10 fac list = range(1l, num num*1) 
11 print "BEFORE:", 'fac list' 


14 i50 


17 while i « len(fac list): 

19 E 

20 if num num $ fac list[i] == O0: 
21 del fac list[(i] 

24 Laiti 


26 # 
27 print"AFTER":,'fac list' 
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6-11. 转 换 。 
(a) 创建 一 个 从 整 型 到 IP 地 址 的 转换 程序 ， 如 下 格式 ; WWWOOOCYYY.ZZZ ° 
(b) 更 新 你 的 程序 ， 使 之 可 以 逆转 换 。 
6-12. 字 符 串 。 
(a) 创建 一 个 名 字 为 findchr() 的 函数 ， 函 数 声明 如 下 。 
deffindchr (string, char) 


findchr() 要 在 字符 串 String 中 查找 字符 char， 找 到 就 返回 该 值 的 索引 ， 和 否则 返回 -1。 
不 能 用 string.*fmd() 或 者 string.*index() 有 函数 和 方法 。 


(b) 创建 另 一 个 叫 rfindchr() 的 函数 ， 查 找 字 符 char 最 后 一 次 出 现 的 位 置 。 它 跟 
findchr() 工 作 类 似 ， 不 过 它 是 从 字符 串 的 最 后 开始 向 前 查找 的 。 


(c) 创建 第 三 个 函数 ， 名 字 叫 subchr()， 声 明 如 下 。 


def subchr (string, origchar, newchar) 
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subchr() 跟 findchr() 类 似 ， 不 同 的 是 ， 如 果 找到 匹配 的 字符 就 用 新 的 字符 蔡 换 原先 字 
符 。 返 回 修改 后 的 字符 串 。 


6-13. 字 符 串 .string 模 块 包 含 三 个 函数 ，atoi()、atol() 和 atof()， 它 们 分 别 负责 把 字符 串 转 
换 成 整 型 、 长 整 型 和 浮 点 型 数字 。 从 Pythonl.5 起 ，Python 的 内 建 函 数 int()、long()、 
float() 也 可 以 做 相同 的 事 了 ，complex() 函 数 可 以 把 字符 串 转换 成 复数 (然而 1.5 之 前 ， 这 
些 转 换 函 数 只 能 工作 于 数字 之 上 ) o 


string 模 块 中 并 没有 实现 一 个 atoc() 函 数 ， 那 么 你 来 实现 一 个 atoc()， 接 受 单个 字符 串 
做 参数 输入 ， 一 个 表示 复数 的 字符 串 ， 例 如 -1. 23e+4-5.67j， 返 回 相应 的 复数 对 
象 。 你 不 能 用 eval() 函 数 ， 但 可 以 使 用 complex() 函 数 ， 而 且 你 只 能 在 如 下 的 限制 之 
下 使 用 : complex():complex (real > imag) 的 real 和 imag 都 必须 是 浮 点 值 。 
6-14. 随 机 数 。 设 计 一 个 “石头 、 剪 子 、 布 "游戏 ， 有 时 又 叫 *Rochambeau”， 你 小 时 候 可 能 
玩 过 ， 下 面 是 规则 。 你 和 你 的 对 手 ， 在 同一 时 间 做 出 特定 的 手势 ， 必 须 是 下 面 一 种 : 石 
头 、 剪 子 、 布 。 胜 利 者 从 下 面 的 规则 中 产生 ， 这 个 规则 本 身 是 个 悖 论 。 
(a) 布 包 石头 。 
(b) 石头 砸 剪子 。 
(c) 剪子 剪 破 布 。 在 你 的 计算 机 版 本 中 ， 用 户 输 入 她 /他 的 选项 ， 计 和 莫 机 找 一 个 随 
机 选项 ， 然 后 由 你 的 程序 来 决定 一 个 胜利 者 或 者 平手 。 注 意 : 最 好 的 算法 是 尽量 少 
的 使 用 if 语 钉 。 


6-15. 转 换 。 


(a) 给 出 两 个 可 识别 格式 的 日 期 ， 比 如 MM/DD/YY 或 者 DD/MM/YY 格 式 ， 计 算出 两 
个 日 期 间 的 天 数 。 


(b) 给 出 一 个 人 的 生日 ， 计 算 从 此 人 出 生 到 现在 的 天 数 ， 包 括 所 有 的 半月。 
(c) 还 是 上 面 的 例子 ， 计 算出 到 此 人 下 次 过 生日 还 有 多 少 天 。 
6-16.4E f » AE E 4E EMF N 83 Ze e A TE o 


6-17. 方 法 。 实 现 一 个 叫 myPop() 的 函数 ， 功 能 类 似 于 列表 的 pop() 方 法 ， 用 一 个 列表 作为 
输入 ， 移 除 列 表 的 最 新 一 个 元 素 ， 并 返回 它 。 


6-18.zip() 内 建 函 数 。 在 6.13.2 节 里 面 关 于 zip() 函 数 的 例子 中 ，zip (fn,In) 返回 的 是 什 
么 ? 


6-19. 多 列 输出 。 有 任意 项 的 序列 或 者 其 他 容器 ， 把 它们 等 距离 分 列 显示 。 由 调用 者 提供 
数据 和 输出 格式 。 例 如 ， 如 果 你 传 入 100 个 项 并 定义 3 列 输出 ， 按 照 需要 的 模式 显示 这 
数据 。 这 种 情况 下 ， 应 该 是 两 列 显示 33 个 项 ， 最 后 一 列 显 示 34 个 。 你 可 以 让 用 户 来 选 
水 平 排序 或 者 重 直 排序 。 


Rm 


RU 
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PTE ”映像 和 集合 类 型 
本 章 主题 
e RAS LER 


e 操作 符 


e 内 建 函 数 
e 内 建 方法 


e 字典 的 键 


e 操作 符 


4 内 建 函 数 
e 内 建 方法 


e 相关 模块 


本 章 我 们 来 讨论 Python 语 言 中 的 映像 类 型 和 集合 类 型 。 和 前 面 的 章节 一 样 ， 我 们 首先 做 一 个 
介绍 ， 再 来 讨论 可 用 操作 符 ， 工 厂 函 数 、 内 建 函 数 (BIF) 和 方法 ， 然 后 再 来 看 看 每 种 数据 类 
型 的 详细 用 法 。 


7.1 映射 类 型 : 字典 


字典 是 Python 语言 中 唯一 的 映射 类 型 。 上 映射 类 型 对 象 里 哈 希 值 (At key) 和 指向 的 对 象 
(4& » value) 是 一 对 多 的 关系 。 它 们 与 Perl 中 的 哈 希 类 型 〈 译 者 注 : 又 称 关联 数组 ) 相似 ， 
通常 被 认为 是 可 变 的 哈 希 表 。 一 个 字典 对 象 是 可 变 的 ， 它 是 一 个 容器 类 型 ， 能 存储 任意 个 数 
的 Python 对 象 ， 其 中 也 包括 其 他 容器 类 型 。 字 典 类 型 和 序列 类 型 容器 类 (列表 、 元 组 ) 的 区 
别 是 存储 和 访问 数据 的 方式 不 同 。 序 列 类 型 只 用 数字 类 型 的 键 (从 序列 的 开始 起 按 数值 顺序 
索引 ) 。 了 映射 类 型 可 以 用 其 他 对 象 类 型 做 键 ， 一 般 最 常见 的 是 用 字符 串 做 键 。 和 序列 类 型 的 
键 不 同 ， 映 像 类 型 的 键 直接 或 间接 地 和 存储 的 数据 值 相关 联 。 但 因为 在 映射 类 型 中 ， 我 们 不 
再 用 “序列 化 排序 "的 键 ， 所 以 映像 类 型 中 的 数据 是 无 序 排列 的 。 


显然 ， 这 并 不 影响 我 们 使 用 映射 类 型 ， 因 为 映射 类 型 不 要 求 用 数字 值 做 索引 以 从 一 个 容器 中 
获取 对 应 的 数据 项 。 你 可 以 用 键 直 接 “ 映 射 "到 值 ， 这 就 是 为 什么 叫 映射 类 型 (“mapping 
type") 的 原因 。 了 映射 类 型 通常 被 称 做 哈 布 表 ， 是 因为 字典 对 象 就 是 哈 硕 类 型 的 。 字 典 是 
Python 中 最 强大 的 数据 类 型 之 一 。 


核心 笔记 : 什么 是 哈 希 表 ? 它们 与 字典 的 关系 是 什么 


dim 用 有 序 的 数字 键 做 索引 将 数据 以 数组 的 形式 存储 。 一 般 索 引 值 与 所 存储 的 数据 
关系 。 还 可 以 用 另 一 种 方式 来 存储 数据 : 基于 某 种 相关 值 ， 比 如 说 一 个 字符 串 。 我 们 在 日 
生活 中 一 直 这 么 做 。 把 人 们 的 电话 号 码 按照 他 们 的 姓 记录 在 电话 簿 上 ， RHHREDAAA 
会 簿 上 添加 事件 ， 等 等 。 在 这 些 例子 中 ， 你 的 键 就 是 和 数据 项 相关 的 值 。 哈 希 表 是 一 种 数据 
结构 : 它 按照 我 们 所 要 求 的 去 工作 。 哈 希 表 中 存储 的 每 一 条 数据 ， 叫 做 一 个 值 (value) ， 是 
根据 与 它 相关 的 一 个 被 称 作 为 键 (key) 的 数据 项 进行 存储 的 。 键 和 值 合 在 一 起 被 称 为 " 键 - 值 
对 ” (key-value pairs) 。 哈 硕 表 的 工法 是 获取 键 ， 对 键 执 行 一 个 叫做 哈 希 函数 的 操作 ， 并 根 
据 计 算 的 结果 ， 选 择 在 数据 结构 的 菜 个 地 址 中 来 存储 你 的 值 。 任 何 一 个 值 存储 的 地 址 党 取 决 
于 它 的 键 。 正 因为 这 种 随意 性 ， 哈 希 表 中 的 值 是 没有 顺序 的 。 你 拥有 的 是 一 个 无 序 的 数据 

集 o 

你 所 能 获得 的 有 序 集 合 只 能 是 字典 中 的 键 的 集合 或 者 值 的 集合 。 方 法 Keys() 或 values() 返 回 一 
个 列表 ， 该 列表 是 可 排序 的 。 你 还 可 以 用 items() 方 法 得 到 包含 键 、 值 对 的 元 组 的 列表 来 排 
序 。 由 于 字典 本 身 是 哈 希 的 ， 所 以 是 无 序 的 。 


哈 希 表 一 般 有 很 好 的 性 能 ， 因 为 用 键 查询 相当 快 。 


Python 的 字典 是 作为 可 变 的 哈 希 表 实 现 的。 如 果 你 熟 和 Perl 的话， 就 可 以 发 现 字典 与 Perl 中 
的 “关系 数组 ?或 散 列 相似 。 


现在 我 们 就 来 研究 Python 字典 。 一 个 字典 条 目的 语法 格式 是 键 值 。 而 且 ， 多 条 字典 条 目 被 包 
含 在 大 括号 (Em 


7.1.1 如 何 创 建 字典 和 给 字典 赋值 


创建 字典 只 需要 把 字典 赋值 给 一 个 变量 ， 不 管 这 个 字典 是 


o 
(GG 
np 
e 
ade 


>>> dictl S f} 


>>> dict2 = ('name': 'earth', 'port': 80) 


o»» gdictl, dict2 
(A ('port': 80, "name': "'"aarth"'.) 


从 Python 2.2 版 本 起 ， 可 以 用 工厂 方法 dict() 来 创建 字典 。 当 我 们 详细 讨论 dict() 的 时 候 会 看 到 
更 多 的 例子 ， 现 在 来 看 一 个 小 例子 。 
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2005 PALEE e Hictiti['x', Il. L'y Z1)) 
>>> fdict 


Dupe go." E 


从 Python 2.3 版 本 起 ， 可 以 用 一 个 很 方便 的 内 建 方法 fromkeys() 来 创建 一 个 “上 默认” 字典， 字典 
中 元 素 具 有 相同 的 值 (如 果 没 有 给 出 ， 黑 认为 None ) 


»»» ddict = ().fromkeys(('x', 'y'), -1) 


»»» ddict 
A I, *'xa*r 2] 
> 


>>> edict = {}.fromkeys (('foo', 'bar')) 
>>> edict 


{'foo': None, 'bar': None} 


7.1.2 ”如何 访问 字典 中 的 值 
要 想 遍 历 一 个 字典 (一 般 用 键 ) ， 你 只 需要 循环 查看 它 的 键 ， 像 这 样 : 


>>> dict2 = ('name': 'earth', 'port': 80) 
>>> 


>>>> for key in dict2.keys(): 


print 'key-$s, value=%s' % (key, dict2[key]) 


key=name, value=earth 
key=port, value-80 


从 Python 2.2 开 始 ， 你 可 以 不 必 再 用 keys() 方 法 获取 供 循环 使 用 的 键 值 列表 了 。 可 以 用 迭代 器 
来 轻松 地 访问 类 序列 对 象 (sequence-like objects) ， 比 如 字典 和 文件 。 只 需要 用 字典 的 名 字 
就 可 以 在 for 循 环 里 遍历 字典 。 


>>> dict2 = ('name': 'earth', 'port': 80) 
>>> 
>>>> for key in dict2: 


print 'key-$s, value-$s' $ (key, dict2[key]) 


keyzname, value-earth 


key-port, value-80 


要 得 到 字典 中 某 个 元 素 的 值 ， 可 以 用 你 所 熟悉 的 字典 键 加 上 中 括号 来 得 到 。 


>>> dict2['name'] 

'earth' 

»»» 

>>> print 'host $s is running on port $d' $ ^ 
(dict2['name'], dict2['port']) 


host earth is running on port 80 


字典 dict1 是 空 的 ， 字 典 dict2 有 两 个 数据 元 素 。 字 典 dict2 的 键 是 mame' 和 'port， 它 们 对 应 的 值 
分 别 是 ‘earth' 和 80。 就 像 你 看 到 的 ， 通 过 键 hame’ 可 以 得 到 字典 中 的 元 素 的 值 。 


如 果 我 们 想 访 问 该 字典 中 的 一 个 数据 元 素 ， 而 它 在 这 个 字典 中 没有 对 应 的 键 ， 将 会 产生 一 个 


错误 : 


>>> dict2['server'] 
Traceback (innermost last): 
File"«stdin»",line l,in? 

KeyError:server 
在 这 个 例子 中 ， 我 们 试图 获得 字典 中 'Server' 键 所 对 应 的 值 。 你 从 上 面 的 代码 知道 ‘server 这 
个 键 并 不 存在 。 检 查 一 个 字典 中 是 否 有 某 个 键 的 最 好 方法 是 用 字典 的 has_key() 方 法 ， 或 者 另 
一 种 比较 好 的 方法 就 是 从 2.2 版 本 起 用 的 ，in 或 not in 操 作 符 。has_key() 方 法 将 会 在 未 来 的 
Python 版 本 中 弃 用 ， 所 以 用 in 或 not in 是 最 好 的 方法 。 


下 面 我 们 将 介绍 字典 所 有 的 方法 。 方 法 has_key() 和 in 以 及 not in 操作 符 都 是 布尔 类 型 的 。 对 于 
前 两 者 而 言 ， 如 果 字 典 中 有 该 键 就 返回 卜 (True) > GUA (False) (Python 2.3 版 本 
以 前 ， 没 有 布尔 常量 ， 为 丨 时 返回 1， 假 时 返回 0) 。 


>>> 'server' in dict2 # or dict2.has key('server') 
Falser 

>>> 'name' in dict # or dict2.has key('name'"') 

True 

>>> dict2['name'] 


'earth' 


一 个 字典 中 混用 数字 和 字符 串 的 例子 : 


>>> dict3 = (] 

>>> dict3[1] = 'abc' 

2»» dict3['1'] = 3.14159 

255 dio6t3[S.2] = 'xyz' 

>>> dict3 

COs "myz', 1i: "abo', TIS 3.214159) 


MEC GE — 3M JAMES S RAIET udedit3se dm o 
dict w (3.21 TEYA"; Es apet, E": 3.14159) 


如 果 事 先 已 经 知道 所 有 的 数据 就 可 以 用 键 - 值 对 来 创建 一 个 字典 (这 是 显而易见 的 ) 。 通 过 字 
典 dict3 的 示例 说 明 你 可 以 采用 各 种 类 型 的 数据 作为 字典 的 键 。 如 果 我 们 被 问 到 是 否 可 以 改变 
某 个 字典 值 的 键 时 ， 你 可 能 会 说 “不 ”， 对 吗 ? 


什么 在 执行 中 字典 中 的 键 不 允许 被 改变 呢 ? 你 这 样 想 就 会 明白 : 比方 说 ， 你 创建 了 一 个 字 
， 字典 中 包含 一 个 元 素 (一 个 键 和 一 个 值 ) 。 可 能 是 由 于 茶 个 变量 的 改变 导致 键 发 生 了 改 
这 时 候 你 如 果 用 原来 的 键 来 取出 字典 里 的 数据 ， 会 得 到 KeyError (因为 键 的 值 已 经 改变 
1) ， 现 在 你 没 办 法 从 字典 中 获取 该 值 了 ， 因 为 键 本 身 的 值 发 生 了 变化 。 由 于 上 面 的 原因 ， 
字典 中 的 键 必 须 是 可 哈 硕 的 ， 所 以 数字 和 字符 串 可 以 作为 字典 中 的 键 ， 但 是 列表 和 其 他 字典 


不 行 ( 见 7.5.2 小 节 字 典 的 键 必 须 是 可 哈 希 的 ) 。 


7.1.3 ”如何 更 新 字典 


你 可 以 通过 以 下 几 种 方式 对 一 个 字典 做 修改 : 添加 一 个 新 数据 项 或 新 元 素 ( 即 ， 一 个 键 - 值 
对 ) ; 修改 一 个 已 存在 的 数据 项 ; 或 删除 一 个 已 存在 的 数据 项 (下 面 有 关于 数据 项 删除 操作 
的 详细 讲述 ) e 


>>> dict2['name'] = 'venus' & 更 新 已 有 条 目 

>>> dict2['port'] = 6969 # 更 新 已 有 条 目 

>>> dict2['arch'] = 'sunos5't 增加 新 条 目 

>>> 

>>> print 'host $(name)s is running on port $(port)d' %dict2 


host venus is runninq on port 6969 


如 果 字 典 中 该 键 已 经 存在 ， 则 字典 中 该 键 对 应 的 值 将 被 新 值 蔡 代 。 上 面 的 print 语 多 展示 了 另 
一 种 在 字典 中 使 用 字符 串 格式 符 (90) 的 方法 。 用 字典 参数 可 以 简化 print 语 甸 ， 因 为 这 样 做 你 
只 需要 用 到 一 次 该 字典 的 名 字 ， 而 不 用 在 每 个 元 素 出 现 的 时 候 都 用 元 组 参数 表示 。 你 也 可 以 
用 内 建 方法 update() 将 整个 字典 的 内 容 添加 到 另 一 个 字典 。 我 们 将 在 7.4 节 介绍 此 方法 。 


7.1.4 如 何 删除 字典 元 素 和 字典 


删除 整个 字典 的 操作 不 常见 。 通 常 ， 你 删除 字典 中 的 单个 元 素 或 是 清除 整个 字典 的 内 容 。 但 
是 ， 如 果 你 申 想 “删除 ”一 个 字典 ， 用 del 语 名 (介绍 见 小 节 3.5.5) 。 以 下 是 删除 字典 和 字典 元 
素 的 例子 


del dict2['name'] # 删除 键 为 "name" 的 条 目 


dict2.clear() t 删除 dicti 中 所 有 的 条 目 
del dict2 # 删除 整个 dict 字典 


dict2.pop('name') # 删除 并 返回 键 为 "w" 的 条 目 





核心 提示 : 避免 使 用 内 建 对 象 名 字 作为 变量 的 标识 符 


如 果 在 Python2.3 前 ， 你 已 经 开始 使 用 Python， 你 可 能 用 dict 作 为 一 个 字典 的 标识 符 。 但 是 ， 

已 成 为 Python 的 类 型 和 工厂 方法 ， 重 载 dict() 会 给 你 带 来 麻烦 和 潜在 的 bugs。 编 
器 允许 你 做 这 样 的 重 载 ， 它 认为 你 是 聪明 的 ， 知 道 自 己 正在 做 什么 ! 小 心 。 请 不 要 用 dict、 

list、file、bool、str、input、len 这 样 的 内 建 类 型 为 变量 命名 。 


7.2 映射 类 型 操作 符 
字典 可 以 和 所 有 的 标准 类 型 操作 符 一 起 工作 ， 但 却 不 支持 像 拼 接 (concatenation) 和 重复 


(repetition). 这 样 的 操作 。 这 些 操作 对 序列 有 意义 ， 可 对 映射 类 型 行 不 通 。 在 接 下 来 的 两 小 
节 里 ， 我 们 将 向 你 讲述 字典 中 的 操作 符 。 


7.2.1 标准 类 型 操作 符 


标准 类 型 操作 符 已 在 第 。 下面 是 一 些 使 用 操作 符 的 简单 示例 : 
»»» dict4 = ['abc': 123] 
>>> dict5 = ('abc': 456] 
>>> dict6 = ('abc': 123, 98.6: 37) 
»»» diet] = "zyz": 123] 


»»» dict4 < dicts 


True 


>>> (dict4 < dict6) and (dict4 < dict?) 
True 

>>> (dict5 < dict6) and (dict5 < dict?7) 
True 

>>> dict6 « dict7 


False 
字典 是 如 何 比较 的 呢 ? 与 列表 和 元 组 一 样 ， 这 个 过 程 比 数字 和 字符 串 的 比较 更 复杂 些 。 详 细 
算法 请 见 第 7.3.1 小 节 
7.2.2 映射 类 型 操作 符 (()) 
1. 字典 的 键 查找 操作 符 


键 查找 操作 符 是 唯一 仅 用 于 字典 类 型 的 操作 符 ， 它 和 序列 类 型 里 单一 元 素 的 切片 (slice) 操 
作 符 很 相 象 。 对 序列 类 型 来 说 ， 用 引 做 唯一 参数 或 下 标 (subscript) 以 获取 一 个 序列 中 茶 个 
元 素 的 值 。 对 字典 类 型 来 说 ， 是 用 键 查 询 (字典 中 的 元 素 ) ， 所 以 键 是 参数 (argument) > 
而 不 是 一 个 索引 (index) 。 键 查找 操作 符 既 可 以 用 于 给 字典 赋值 ， 也 可 以 用 于 从 字典 中 取 
值 : 


diky 通过 键 k'， 给 字典 中 茶 元 素 赋 值 V'; 
dik] 通过 键 'K， 查 询 字典 中 某 元 素 的 值 。 
2. (4£) 成 员 关系 操作 (in 、notin) ° 


从 Python 2.2 起 ， 程 序 员 可 以 不 用 has_key() 方 法 ， 而 用 in 和 not in 操作 符 来 检查 某 个 键 是 否 存 
在 于 字典 中 : 


>>> 'name' in dict2 
True 
>>> 'phone' in dict2 


False 


7.3 映射 类 型 的 内 建 函 数 和 工厂 函数 


7.3.1 标准 类 型 函数 [type()、str(0 和 cemp()] 


如 你 所 料 ， 对 一 个 字典 调用 type() 工 厂 方法 ， 会 返回 字典 类 型 "type ‘dict'>”。 调 用 str() 工 厂 
方法 将 返回 该 字典 的 字符 串 表 示 形 式 ， 这 些 都 很 容易 理解 。 


在 前 面 的 章节 里 ， 我 们 已 经 讲述 了 用 cmp() 内 建 函 数 来 操作 数字 、 字 符 囊 、 列 表 和 元 组 。 那 么 
字典 又 是 如 何 比 较 的 呢 ? 字典 是 通过 这 样 的 算法 来 比较 的 : 首先 是 字典 的 大 小 ， 然 后 是 键 ， 
最 后 是 值 。 可 是 ， 用 cmp() 做 字典 的 比较 一 般 不 是 很 有 用 。 


接 下 来 的 小 节 里 ， 将 进一步 详细 说 明 字 典 比 较 的 算法 ， 但 这 部 分 是 高 层次 的 阅读 内 容 ， 可 以 
跳 过 ， 因 为 字典 的 比较 不 是 很 有 用 也 不 常见 

* 字 典 比较 算法 

接 下 来 的 例子 中 ， 我 们 建立 两 个 行 比较 ， 然 后 慢 慢 修改 ， 来 看 看 这 些 修 改 对 它们 之 间 
的 比较 带 来 的 影响 : 


>>> dictl () 


2»» dict2 = ['host': 'earth', 'port': 80) 


2»» emp(dictl, dict2) 

-1 

>>> diectll'host'] = 'earth' 
>>> cmp(dictl, dretz) 

一 


在 第 一 个 比较 中 ，dict1 比 dict2 小 ， 因 为 dict2 有 更 多 元 素 (2 个 vs.0 个 ) 。 在 向 dict1 添 加 一 个 元 
素 后 ，dict1 仍 然 比 dict2 小 (2vs.1) ， 虽 然 添 加 的 元 素 在 dict2 中 也 存在 。 


»»» dictl['port'] = 8080 
>>> cmp(dictl, dictz) 


>2> dictl['port'] = 80 
>>> emp(dictl, dict2) 


在 向 dict1 中 添加 第 二 个 元 素 后 ， 两 个 字典 的 长 度 相 同 ， 所 以 用 键 比 较 大 小 。 这 时 键 相等 ， 则 

通过 它们 的 值 比较 大 小 。 键 'host' 的 值 相 同 ， 对 于 键 'port，dict1 中 值 比 dict2 中 的 值 大 〈8080 

vs. 80) 。 当 把 dict2 中 ‘port 的 值 设 成 和 dict1 中 的 值 一 样 ， 那 么 两 个 字典 相等 : 它们 有 相同 的 

大 小 、 相 同 的 键 、 相 同 的 值 ， 所 以 cmp() 返 回 值 是 0。 (本 段 原文 中 为 “dict2 中 值 比 dict1 中 的 值 
大 ”， 应 为 笔者 之 误 ) 


ttl "Et w ttep 
>>> cmp(dictl, dict2) 


>>>- dlot2['prot']  'udp' 
>>>: cmp(dictl, dict2) 
-1 


当 向 两 个 字典 中 的 任何 一 个 添加 新 元 素 时 ， 这 个 字典 马上 会 成 为 大 的 那个 字典 ， 就 像 例子 中 
的 dict1 一 样 。 向 dict2 添 加 键 - 值 对 后 ， 因 为 两 个 字典 的 长 度 又 相等 了 ， 会 继续 比较 它们 的 键 和 


值 。 


22» 


>>> 


14 


cdict = ('fruits':1) 
ddict = ('fruits':1l) 


cmp(cdict, ddict) 


cdict['oranges'] = 0 
ddict['apples'] = 0 
cmp(cdict, ddict) 


上 面 的 例子 表明 cmp() 可 以 返回 除 -1、0、1 外 的 其 他 值 。 算 法 按照 以 下 的 顺序 。 


(1) 比较 字典 长 度 


如 果 字 典 的 长 度 不 同 ， 那 么 用 cmp (dict1，dict2) 比较 大 小 时 ， 如 果 字 典 dict1 比 dict2 长 ， 
cmp() 返 回 正 值 ; 如 果 dict2 比 dict1 长 ， 则 返回 负 值 。 也 就 是 说 ， 字 典 中 的 键 的 个 数 越 多 ， 这 个 
字典 就 越 大 ， 即 


len (dictl) > len(dict2) = dicti > dict2 


(2) 比较 字典 的 键 


如 果 两 个 字典 的 长 度 相 同 ， 那 就 按 字 典 的 键 比较 ; 键 比较 的 顺序 和 keys() 方 法 返回 键 的 顺序 相 
同 。 (注意 : 相同 的 键 会 映射 到 哈 希 表 的 同一 位 置 ， 这 保证 了 对 字典 键 的 检查 的 一 致 性 。) 

这 时 ， 如 果 两 个 字典 的 键 不 匹配 时 ， 对 这 两 个 (不 匹配 的 键 ) 直接 进行 比较 。 当 dict1 中 第 一 
个 不 同 的 键 大 于 dict2 中 第 一 个 不 同 的 键 ，cmp() 会 返回 正 值 。 


(3) 比较 字典 的 值 


如 果 两 个 字典 的 长 度 相同 而 且 它 们 的 键 也 完全 匹配 ， 则 用 字典 中 每 个 相同 的 键 所 对 应 的 值 进 
行 比较 。 一 旦 出 现 不 匹配 的 值 ， 就 对 这 两 个 值 进行 直接 比较 。 若 dict1 比 dict2 中 相同 的 键 所 对 
应 的 值 大 ，cmp() 会 返回 正 值 。 


(4) 完全 匹配 


到 此 为 止 ， 每 个 字典 有 相同 的 长 度 、 相 同 的 键 ， 每 个 键 也 对 应 相同 的 值 ， 则 字典 完全 匹配 ， 
返回 0 值 。 


图 7-1 说 明了 上 述 字典 比较 的 算法 


[STARTwith ^w 
\ both dictionaries 一 


Comparing dictionaries 


x N JUR. 


Z Lengths v, No / Keys NNo ; ^ Values N No 
N differ? / differ? 一 N — 
Y Y RvA 
"| Yes Yes 








图 7-1 字典 是 如 何 进 行 比 较 的 


7.3.2. 映射 类 型 相关 的 函数 
dict() 


工厂 函数 被 用 来 创建 字典 。 如 果 不 提供 参数 ， 会 生成 空 字典 。 当 容器 类 型 对 象 作为 一 个 参数 
传递 给 方法 dict() 时 很 有 意思 。 如 果 参 数 是 可 以 兴 代 的 ， 即 一 个 序列 ， 或 是 一 个 迭代 器 ， 或 是 
一 个 支持 迭代 的 对 象 ， 那 每 个 可 和 迭代 的 元 素 必须 成 对 出 现 。 在 每 个 值 对 中 ， 第 1 个 元 素 是 字典 


的 键 ， 第 2 个 元 素 是 字典 中 的 值 。 见 Python 文档 里 关于 dict() 的 例子 : 


> 
('y': 2, 'x': 1) 

2595 reel (tr 11, Lup TI 

['u';2. es 1] 

»»» dict([('xy'[i-1], i) for i in range(1,3)]) 
(yr 2. ant d 


如 果 输 入 参数 是 (A) 一 个 映射 对 象 ， 比 如 ， 一 个 字典 对 象 ， 对 其 调用 dict() 会 从 存在 的 字典 
里 复制 内 容 来 生成 新 的 字典 。 新 生成 的 字典 是 原来 字典 对 象 的 浅 复 制版 本 ， 它 与 用 字典 的 内 
建 方法 copy() 生 成 的 字典 对 象 是 一 样 的 。 但 是 从 已 存在 的 字典 生成 新 的 字典 速度 比 用 copy() 方 

法 慢 ， 我 们 推荐 使 用 copy() 。 


从 Python2.3 开 始 ， 调 用 dict() 方 法 可 以 接受 字典 或 关键 字 参 数字 典 (函数 操作 符 ， 第 十 一 
章 ) 。 

>>> dict(x-1, y=2) 

(y': 2, 'x's 1) 

22» dict8 = dict(x-1, y=2) 

>>>: dict8 

by s2, wr 4 

>>> dict9 = dict(**dict8) 

>>> dict9 

[v4 25; 'x' lj 


我 们 提醒 读者 dict9 的 例子 只 作为 了 解 dict() 方 法 的 用 途 ， 它 不 实 中 的 例子 。 使 用 下 面 这 
行 的 方法 更 聪明 (效率 更 好 ) o 


>>> dict9 = dict8.copy() 
>>> dict9 
[ee 4 "ud d] 


len() 


内 建 函 数 len() 很 灵活 。 它 可 用 在 序列 、 了 映像 类 型 和 集合 上 (在 本 章 的 后 面 我 们 会 看 到 ) 。 对 
字典 调用 len()， 它 会 返回 所 有 元 素 ( 键 - 值 对 ) 的 数目 : 


22» dict2 = ('name': 'earth', 'port': 80) 
>>> dict2 

('port': 80, 'name': 'earth') 

>>> len(dict2) 

2 


我 们 前 面 提 到 字典 中 的 元 素 是 没有 顺序 的 。 从 上 面 的 例子 中 可 以 看 到 ，dict2 的 元 素 显 示 的 顺 
序 和 输入 时 的 顺序 正 相 反 。 


hash() 
内 建 函 数 hash() 本 身 并 不 是 为 字典 设计 的 方法 ， 但 它 可 以 判断 某 个 对 象 是 否 可 以 做 一 个 字典 的 
键 。 将 一 个 对 象 作为 参数 传递 给 hash()， 会 返回 这 个 对 象 的 哈 希 值 。 只 有 这 个 对 象 是 可 哈 硕 
的 ， 才 可 作为 字典 的 键 (函数 的 返回 值 是 整 型 ， 不 产生 错误 或 异常 ) 。 
如 果 用 比较 操作 符 来 比较 两 个 数值 ， 发 现 它们 是 相等 的 ， 那 么 即使 二 者 的 数据 类 型 不 同 ， 它 
们 也 会 得 到 相同 的 哈 希 和 值 。 
如 果 非 可 哈 希 类 型 作为 参数 传递 给 hash() 方 法 ， 会 产生 TypeError 错 误 ( 因此， 如果 使 用 这 样 
的 对 象 作 为 键 给 字典 赋值 时 会 出 错 ) 

>>> hash([]) 

Traceback (innermost last): 

File "4stdin»", lins 1, in ? 

TypeError: list objects are unhashable 

»»» 

»»» dict2[()] = 'foo' 

Traceback (most recent call last): 


File "«stdin»", line 1l, in ? 


TypeError: dict objects are unhashable 


在 表 7.1 中 ， 我 们 列 出 以 下 3 个 映射 类 型 的 相关 前 数 。 
m 7.1 










E fi 


EZANI BE. DEAS [f container). BUBJUPS AE FLAGS A. F 
划 就 创建 一 个 空 学 奥 

返回 映射 的 长 度 《 刍 - 值 对 的 个 数 ) 
hash(obj) HEL obj 的 喻 希 值 


D 数 





dict([container]) 








len(mapping) 








7.4 映射 类 型 内 建 方法 


字典 提供 了 大 量 方 法 来 帮 我 们 做 事情 ， 见 表 7.2。 


下 面 说 明 字典 的 一 些 很 常见 的 方法 。 在 上 面 的 例子 里 ， 我 们 已 经 看 到 has_key() 和 它 的 替代 方 
法 in 和 not in。 如 我 们 在 7.1 小 节 看 到 ， 试 图 查找 一 个 字典 里 没有 的 键 值 会 产生 KeyError 异 常 


基本 的 字典 方法 关注 他 们 的 键 和 值 。 它 们 有 : keys() 方 法 ， 返 回 一 个 列表 ， 包 含 字典 中 所 有 的 
键 ，values() 方 法 ， 返 回 一 个 列表 ， 和 包含 字典 中 所 有 的 值 ，items()， 返 回 一 个 包含 所 有 ( 键 ， 
值 ) 元 组 的 列表 。 这 些 方法 在 不 按 任何 顺序 遍历 字典 的 键 或 值 时 很 有 用 。 


>>> dict2.keys() 
['*port', 'name'] 
> dict2.values(t) 
(80, 'earth'] 
>>> 
> dict2.items() 
[('port', 80), ('name', 'earth')] 
>>> 
>>> for eachKey in dict2.keys(): 


. print 'dict2 key', eachKey, 'has value', dict2[eachKey] 


dict2 key port has value 80 


dict2 key name has value earth 


keys() 方 法 很 有 用 ， 它 返回 一 个 包含 字典 中 所 有 键 的 列表 ， 此 方法 可 以 与 for 循 环 一 起 使 用 来 获 
取 字 典 中 的 值 。 














A72 
方法 名 学 & n 
id dict. clear " () ue y^ 中 ,所 有 n * 
dict clear" () j BEA, mr 的 一 MW 





创建 并 返回 一 个 新 字典 ， 以 seq "PIC LACE AIR. val 做 该 字典 中 所 有 键 对 


di omheys (sog wee) 应 的 接续 值 《 如 果 不 提供 此 什 ， 划 默认 为 None) 





时 字典 dict 中 的 键 key， 返 回 它 对 应 的 值 veluve， 如 果 字 典 中 不 不在 此 键 ， 则 返回 
default HW GER, SR default 的 默认 值 为 None) 





dict.getikey, default» Nonc)" 








mautritcrmer eed 返回 True， 和 否则 返回 False. 在 Python2.2 版 本 引入 in 和 not 


dicthes key(hey) im 后 ， 此 方法 几乎 已 废弃 不 用 了 ， 但 仍 提 供 一 个 可 工作 的 接口 
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"nx 
方法 名 这 M5 ø 
dict.items() Xp —t y AP. (od oc Oo» 
dict.keys() 返回 一 个 包含 学 类 中 人 键 的 列表 
dictiiered0) 方法 iteritems(). iterkeys(). itervalues() 与 它们 对 上 示 的 非 选 代 方 法 一 样 ， 不 同 的 是 它 


们 逝 回 一 个 磷 代 了 乞 ， 而 不 是 一 个 列表 


和 方法 get0) 相 似 。 如果 学 和 典 中 key 键 存在 ， 剩 除 并 返回 dict[key]: 如果 key 键 不 存 


dict pop* (key[,default]) 在 ， 且 没有 给 出 defaul 的 值 ， 则 引 爱 KeyError 异常 


dict.setdefault(key, default» None) 和 方法 sex MM, (010 C ACUTE TE key 键 ， 由 dict[key]9default A'ERA 
dict.update(dict2)" RET dicto (98-400 s A diet 
dict. values() 返回 一 个 包含 字典 中 所 有 值 的 列表 
& Python 1,5 JA. 
b XTUEWMRIÁLM SO TERES 6.19 节 ， 
€. Python2.3 新 增 。 
4. Python2.2 新 增 ， 
€. Python2.0 Bf. 


但 是 ， 它 返回 的 元 素 是 没有 顺序 的 《和 哈 布 表 中 的 键 一 样 ) ， 我 们 通常 希望 它们 能 按 某 种 方 
式 排序 。 
在 Python 2.4 版 本 以 前 ， 你 只 能 调用 字典 的 keys() 方 法 获得 键 的 列表 ， 然 后 调用 列表 的 sort() 方 
法 得 到 一 个 有 序 可 人 遍历 的 列表 。 现 在 特别 为 迭代 子 设计 了 一 个 名 为 sorted() 的 内 建 函 数 ， 它 返 
回 一 个 有 序 的 迭代 子 : 

>>> for eachKey in sorted(dict2): 

TC print 'dict2 key', eachKey, 'has value', 

dict2[eachKey] 

dict2 key name has value earth 


dict2 key port has value 80 


update() 方 法 可 以 用 来 将 一 个 字典 的 内 容 添加 到 另外 一 个 字典 中 。 字 典 中 原 有 的 键 如 果 与 新 添 
加 的 键 重复 ， 那 么 重复 键 所 对 应 的 原 有 条 目的 值 将 被 新 键 所 对 应 的 值 所 履 盖 。 原 来 不 存在 的 
条 目 则 被 添加 到 字典 中 。clear() 方 法 可 以 用 来 删除 字典 中 的 所 有 的 条 目 。 

>>> dict2= ('host': 'earth', 'port': 80) 

>>> dict3- ('host': 'venus', 'server': 'http') 

>>> dict2.update (dict3) 

>>> dict2 

('server': 'http', 'port': 80, 'host': 'venus') 

>>> dict3.clear() 

>>> dict3 

() 
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copy() 方 法 返回 一 个 字典 的 副本 。 注 意 这 只 是 浅 复 制 。 关 于 浅 复 制 和 深 复 制 请 阅读 小 节 6.19 。 
最 后 要 说 明 ，get() 方 法 和 键 查找 (key-lookup) 操作 符 (M) 相似 ， 不 同 的 是 它 允 许 你 为 不 存 
在 的 键 提供 默认 值 。 如 果 该 键 不 存在 ， 也 未 给 出 它 的 默认 值 ， 则 返回 None。 此 方法 比 采 用 键 
查找 (key-lookup) 更 灵活 ， 因 为 你 不 必 担 心 因 键 不 存在 而 引发 异常 。 


>>> dict4 = dict2.cöopy() 


>>> dict4 


('server': 'http', 'port': 80, "host": 'venus') 
»»» dict4.get('host') 

'venus' 

>>> dict4.get('xxx') 

»»» type(dict4.get('xxx')) 

«type 'None'» 

»»» dict4.get('xxx', 'no such key') 


'no such key' 


setdefault() 是 自 2.0 才 有 的 内 建 方法 ， 使 得 代码 更 加 简洁 ， 它 实现 了 常用 的 语法 : 检查 字典 中 
是 否 含有 某 键 。 如 果 字 典 中 这 个 键 存 在 ， 你 可 以 取 到 它 的 值 。 如 果 所 找 的 键 在 字典 中 不 存 
在 ， 你 可 以 给 这 个 键 赋 默 认 值 并 返回 此 值 。 这 正 是 执行 setdefault() 方 法 的 目的 。 


>>> myDict = ('host': 'earth', 'port': 80) 
»»» myDict.keys() 

['*host', 'port'] 

>>> myDict.items() 

(Chost; 'earth'), ('port', 80)] 

>>> myDict.setdefault('port', 8080) 

80 

>>> myDict.setdefault('prot', 'tcp') 

'tcp' 

>>> myDict.items() 

[('prot', 'tcp'), ('host', 'earth'), ('port', 80)] 


前 面 ， 我 们 曾 简要 介绍 过 fromkeys() 方 法 ， 下 面 是 更 多 的 示例 。 


>>> ().fromkeys('xyz') 


('y': None, 'x': None, 'z': None] 
>>> 
>>> ().fromkeys(('love', 'honor'), True) 


('love': True, 'honor': True) 


H 3j > keys() 、items() 和 values() 方 法 的 返回 值 都 是 列表 。 数 据 集 如 果 很 大 会 导致 很 难处 理 ， 
这 也 正 是 iteritems()、 A fedens: My 添加 到 Python 2.28) ŁZA o 3x 6 jS ZI 
与 返回 列表 的 对 应 方法 相似 ， 只 是 它们 返回 惰性 赋值 的 迭代 器 ， 所 以 节省 内 存 。 未 来 的 

Python 版 本 中 ， 甚 至 会 更 灵活 ， 那 时 这 些 方法 将 会 返回 强大 的 对 象 ， 暂 叫做 视图 (views) ° 
视图 是 访问 容器 对 象 的 接口 集 。 举 例 来 说 ， 你 可 以 从 一 个 视图 中 删除 某 个 字典 的 键 ， 从 而 改 


7.5 字典 的 键 


没有 任何 限制 。 他 们 可 以 是 任意 Python 对 象 ， 即 从 标准 对 象 到 用 户 自 定义 对 象 蕴 
典 中 的 键 是 有 类 型 限制 的 。 


«3| 
Ii 
P 
4} 
"Xe mi 


7.5.4 不 允许 一 个 键 对 应 多 个 值 
你 必须 明确 一 条 原则 : 每 个 键 只 能 对 应 一 个 项 。 也 就 是 说 ， 一 键 对 应 多 个 值 是 不 允许 的 ( 像 
列表 、 元 组 和 其 他 字典 这 样 的 容器 对 象 是 可 以 的 ) o SARRAR ( 即 字典 键 重复 赋 
值 ) ， 取 最 后 〈 最 近 ) 的 赋值 。 

s» Hictl = [' fGog': 789, 'foo': "xyz')] 


>>> dictl 


"OO '"Xyz'I 

>>> 

»»» dictl['foo'] ~ l23 
>>> dicti 

t'Too's 123] 
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这 样 做 的 话 ， 在 每 个 键 - 值 对 赋值 的 时 候 都 会 做 检查 ， 这 将 会 占用 一 定量 的 内 存 。 在 上 面 的 例 
子 里 ， 键 foo' 被 列 出 两 次 ，Python 从 左 到 右 检 查 键 - 值 对 。 首 先 值 789 被 赋值 〈 给 键 foo' 所 对 应 
的 值 ) ， 然 后 又 很 快 被 字符 串 'XyzZ' 替 代 。 当 给 字典 中 一 个 不 存在 的 键 赋值 时 ， 键 和 值 会 被 创 
建 和 添加 ， 但 如 果 该 键 已 经 存在 ( 键 冲突 ) ， 那 此 键 所 对 应 的 值 将 被 蔡 换 。 上 面 例子 中 ， 
键 foo' 所 对 应 的 值 被 蔡 换 了 两 次 ; 最 后 的 赋值 语句 ， 值 123 代 蔡 了 值 :xyz’。 


7.5.2. 4 ped 


我 们 在 小 节 7.1 说 过 ， 大 多 数 Python 对 象 可 以 作为 键 ; 但 它们 必须 是 可 哈 硕 的 对 象 。 像 列表 和 
字典 这 样 的 可 变 类 型 ， 由 于 它们 不 是 可 哈 希 的 ， 所 以 不 能 作为 键 。 


所 有 不 可 变 的 类 型 都 是 可 哈 希 的 ， 因 此 它们 都 可 以 作为 字典 的 键 。 一 个 要 说 明 的 是 问题 是 数 
字 : 值 相 等 的 数字 表示 相同 的 键 。 换 句 话 来 说 ， 整 型 数字 1 和 浮 点 型 1.0 的 哈 希 值 是 相同 的 ， 
即 它们 是 相同 的 键 。 


同时 ， 也 有 一 些 可 变 对 象 (很 少 ) 是 可 哈 希 的 ， 它 们 可 以 做 字典 的 键 ， 但 很 少见 。 举 一 个 例 
子 ， 一 个 实现 了 _hash_() 特 殊 方法 的 类 。 因 为 “hash_() 方 法 返回 一 个 整 型 ， 所 以 仍然 是 用 
不 可 变 的 值 (做 字典 的 键 ) 。 


为 什么 键 必 须 是 可 哈 硕 的 ? 解释 器 调用 哈 希 函数 ， 根 据 字 典 中 键 的 值 来 计算 存储 你 的 数据 的 
位 置 。 如 果 键 是 可 变 对 象 ， 它 的 值 可 改变 。 如 果 键 发 生变 化 ， 哈 希 函 数 会 映像 到 不 同 的 地 址 
来 存储 数据 。 如 果 这 样 的 情况 发 生 ， 哈 希 函 数 就 不 可 能 可 靠 地 存储 或 获取 相关 的 数据 。 选 择 
可 哈 希 的 键 的 原因 就 是 因为 它们 的 值 不 能 改变 (此 问题 在 Python FAQ 中 也 能 找到 答案 ) 。 


我 们 知道 数字 和 字符 串 可 以 被 用 做 字典 的 键 ， 但 元 组 又 怎么 样 呢 ? 我 们 知道 元 组 是 不 可 变 

的 ， 但 在 小 节 6.17.2， 我 们 提示 过 它们 也 可 能 不 是 一 成 不 变 的 。 用 元 组 做 有 效 的 键 ， 必 须要 加 
限制 : 元 组 中 只 包括 像 数 字 和 字符 串 这 样 的 不 可 变 参 数 ， 才 可 以 作为 字典 中 有 效 的 键 。 

我 们 用 一 个 程序 (userpw.py 例 7.1) ， 来 为 本 章 关 于 字典 的 讲述 做 个 小 结 。 这 个 程序 是 用 于 管 
理 用 户 名 和 密码 的 模拟 登录 数据 系统 。 脚 本 接受 新 用 户 的 信息 : 

这 个 程序 管理 用 于 登录 系统 的 用 户 信息 : 登录 名 字 和 密码 。 登 录用 户 账 号 建立 后 ， 已 存在 用 
户 可 以 用 登录 名 字 和 密码 重 返 系统 。 新 用 户 不 能 用 别人 的 登录 名 建立 用 户 账号 。 


例 7.1 
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$!/usr/bin/env python 


db - () 


prompt = 'login desired: ' 
while True: 
name * raw input (prompt) 


1 
2 
3 
4 
5 def newuser(): 
6 
7 
8 
9 if db.has key(name): 


10 prompt = 'name taken, try another: ' 
11 continue 

12 eise: 

13 break 

14 pwd * raw input('passwd: ') 
15 db[name] * pwd 

16 

17 def olduser(): 

18 name = raw input('login: *') 

19 pwd = raw input('passwd: ') 

20 passwd = db.get(name) 

21 if passwd == pwd: 

22 print 'welcome back', name 
23 eise: P 

24 print 'login incorrect' 

25 


26 def showmenul): 

21 prompt = """ 

28 (N)ew User Login 

29 (E)xisting User Login 
30 (Qhuit 


4]7.2 Dictionary Example (userpw.py) (continued) 
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ce = raw input(prompt).strip()[0].lower() 


11 except (EOFError, KeyboardInterrupt): 


他 们 提供 登录 名 和 密码 。 账 号 建立 后 ， 已 存在 用 户 可 用 登录 名 和 正确 的 密码 重 返 系统 。 新 用 
户 不 能 用 别人 的 登录 名 建立 账号 。 


4 UE 

1-3fT 

在 Unix 初 始 行 后 ， 我 们 用 一 个 空 用 户 数据 库 初 始 化 程序 。 因 为 我 们 没有 把 数据 存储 在 任何 地 

方 ， 每 次 程序 执行 时 都 会 新 建 一 个 用 户 数据 库 。 

5 ~ 15 行 

newuser() 函 数 用 来 建立 新 用 户 。 它 检查 名 字 是 否 已 经 存在 ， 如 果 证 实 是 一 个 新 名 字 ， 将 要 求 
用 户 输入 他 或 她 的 密码 (我们 这 个 简单 的 程序 没有 加 密 ) ， 用 户 的 密码 被 存储 在 字典 里 ， 以 

他 们 的 名 字 做 字典 中 的 键 。 

17 ~ 24 行 


olduser() 函 数 处 理 返回 的 用 户 。 如 果 用 户 用 正确 的 用 户 名 和 密码 登录 ， 打 出 欢迎 信息 。 否 则 
通知 用 户 是 无 效 登录 并 返回 菜单 。 我 们 不 会 采用 一 个 无 限 循 环 来 提示 用 户 输 入 正确 的 密码 ， 
因为 用 户 可 能 会 无 意 进 入 错误 的 菜单 选项 。 


26 ~ 51 行 


真正 控制 这 个 脚本 的 是 showmenu() 函 数 ， 它 显示 给 用 户 一 个 友好 界面 。 提 示 信 息 被 包括 在 三 
引号 里 ("") ， 这 样 做 是 因为 提示 信息 跨 多 行 ， 而 且 比 单行 包含 \n' 符 号 的 字符 串 更 容易 处 
理 。 菜 单 显示 后 ， 它 等 待 用 户 的 有 效 输入 ， 然 后 根据 菜单 选项 选择 操作 方式 。try-expect 语 句 
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和 第 6 章 stack.py queue.py 例 子 里 的 一 样 ( 见 小 节 6.14.1) ° 
53 ~ 54 行 


KU 接 执行 〈 不 是 通过 import 方 式 ) > RRA AA MA showmenu() $ Zt 2474 
。 下面 是 我 们 的 脚本 运行 结果 


$ userpw.py 

(N)ew User Login 
(E)xisting User Login 
(Q)uit 

Enter choice: n 

You picked: [n] 

login desired: king arthur 
passwd: grail 

(N)ew User Login 
(E)xisting User Login 
(Q)uit 

Enter choice: e 

You picked: [e] 

login: sir knight 
passwd: flesh wound 
login incorrect 

(N)ew User Login 
(E)xisting User Login 
(Q)uit 

Enter choice: e 

You picked: [e] 

login: king arthur 
passwd: grail 

welcome back king arthur 
(N)ew User Login 
(E)xisting User Login 
(Q)uit 

Enter choice: ^D 


You picked: [q] 
7.6 集合 类 型 


数学 上 ， 把 set 称 做 由 不 同 的 元 素 组 成 的 集合 ， 集 合 (set) 的 成 员 通常 被 称 做 集合 元 素 (set 
elements) 。 Python 把 这 个 概念 引入 到 它 的 集合 类 型 对 象 里 。 集 合 对 象 是 一 组 无 序 排列 的 可 
哈 希 的 值 。 是 的 ， 集 合成 员 可 以 做 字典 中 的 键 。 数 学 集合 转 为 Python 的 集合 对 象 很 有 效 ， 集 


& X f ill iX feunion 、intersection 等 操作 符 在 Python 里 也 同样 如 我 们 所 预想 地 那样 工作 。 


和 其 他 容器 类 型 一 样 ， 集 合 支持 用 in 和 not in 操作 符 检 查 成 员 ， 由 len() 内 建 函 数 得 到 集合 的 基 
数 (大 小 ) ， 用 for 循 环 兴 代 集 合 的 成 员 。 但 是 因为 集合 本 身 是 无 序 的 ， 你 不 可 以 为 集合 创建 
索引 或 执行 切片 (slice) 操作 ， 也 没有 键 可 用 来 获取 集合 中 元 素 的 值 。 


集合 有 两 种 不 同 的 类 型 ， 可 变 集合 (set) 和 不 可 变 集 合 (frozenset) 。 如 你 所 想 ， 对 可 变 集 
合 ， 你 可 以 添加 和 删除 元 素 ， 对 不 可 变 集 合 则 不 允许 这 样 做 。 请 注意 ， 可 变 集 合 不 是 可 哈 希 
的 ， 因 此 既 不 能 用 做 字典 的 键 也 不 能 做 其 他 集合 中 的 元 素 。 不 可 变 集合 则 正好 相反 ， 即 ， 他 
们 有 哈 希 值 ， 能 被 用 做 字典 的 键 或 是 作为 集合 中 的 一 个 成 员 。 


集合 最 早出 现在 Python2.3 版 本 中 ， 通 过 集合 模块 来 创建 ， 并 通过 ImmutableSet 类 和 Set 类 进 
行 访问 。 而 后 来 ， 大 家 都 认为 把 它们 作为 内 建 的 数据 类 型 是 个 更 好 的 主意 ， 因 此 这 些 类 被 用 C 
重 写 改进 后 包含 进 Python2.4。 关 于 集合 类 型 和 这 些 类 改进 的 更 多 内 容 ， 可 阅读 此 文 获得 详 
情 : PEP 218， 链 接地 址 : http://python.org/peps/pep-0218.html。 


虽然 现在 集合 类 型 已 经 是 Python 的 基本 数据 类 型 了 ， 但 它 经 常会 以 用 户 自 定义 类 的 形式 出 现 
在 各 种 Python 程序 中 ， 就 像 复数 一 样 〈 复 数 从 Python1.4 版 本 起 成 为 python 的 一 个 数据 类 
型 ) ， 这 样 重复 的 劳动 已 数不胜数 了 。 在 现在 的 Python 版 本 之 前 ， (即使 集合 类 型 对 许多 人 
的 程序 来 说 并 不 是 最 理想 的 数据 结构 ，) 许多 人 仍然 试图 给 列表 和 字典 这 样 的 Python 标 准 类 
型 添加 集合 功能 ， 这 样 可 以 把 它们 作为 监 正 集合 类 型 的 代理 来 使 用 。 因 此 现在 的 使 用 者 有 包 
括 “ 丨 正 " 集 合 类 型 在 内 的 多 种 选择 。 


在 我 们 详细 讲述 Python 的 集合 对 象 之 前 ， 我 们 必须 理解 Python 中 的 一 些 数学 符号 〈 见 表 
7.3) ， 这 样 对 术语 和 功能 有 一 个 清晰 的 了 解 。 















































5k 73 集合 操作 符 和 关系 符号 
数 学 符号 Python 符号 说 y 
e in 是 .的 成 员 
€ not in 不 是 _. 的 成 员 
= | 等 于 
4 
" 不 等 了 
di 
c 是 .的 (严格 ) 子 集 
4 —————— 
c 一 是 .的 子 集 (包括 非 严 格子 集 》 
23 是 .的 【严格 ) 超 集 
= »- 是 .的 超 集 〈 包 括 非 严格 超 集 ) 
' | a i za 
: E 合集 
8 ELEELE 
MEOS 





集合 与 列表 (fs (Q) 不 同 ， 没 有 特别 的 语法 格式 。 列 表 和 字典 可 以 分 别 用 他 们 自己 





的 工厂 方法 list() 和 dict() 创 建 ， 这 也 是 集合 被 创建 的 唯一 方法 一 一 用 集合 的 工厂 方法 set() 和 
frozenset() : 

>>> s = set('cheeseshop') 

>>> S 


set(['c', 'e', 'h', 'o', "o. 's']) 


»»s» tU 


frozenset('bookshop') 

S50 € 

froseénset(['D', Th 'k', 'G', '"5', ST) 
>>> type(s) 

«type 'set'» 

>>> type(t) 

«type 'frozenset'» 


>>> len(s) 


6 

>>> len(s) == len(t) 
True 

>>> s = t 

False 


7.6.2 ”如 何 访 问 集合 中 的 值 


可 以 遍历 查看 集合 成 员 或 检查 某 项 元 素 是 否 是 一 个 集合 中 的 成 员 。 


so "x" im s 
False 

poo "E" Am t 
True 

55» 'c' not in t 
True 

555 Zur 1 inm 3 
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7.6.3 ”如何 更 新 集合 


用 各 种 集合 内 建 的 方法 和 操作 符 添 加 和 删除 集合 的 成 员 。 
> z') 


SR S 


Soto Gor "wu. Br "et, "E'V ter TES 

»»» s.update('pypi') 

>>> S 

Se i "ey o '"R' ohy "aft aft Tas TaT) 

>>> S.remove('z"') 

>>> $ 

SEEL E Wa a Me Or Dip W MT 

>>> s -= set('pypi') 

>>> S 

set((i'c', *a', 'h', Torp Do]) 

我 们 之 前 提 到 过 ， 只 有 可 变 集合 能 被 修改 。 试 图 修改 不 可 变 集合 会 引发 异常 。 
22» t.add('z') 


Traceback (most recent call last): 


File "«stdin»", line 1, in ? 


AttributeError: 'frozenset' object has no attribute 'add' 


7.6.4 如 何 删除 集合 中 的 成 员 和 集合 

前 面 我 们 看 到 如 何 删 除 集合 成 员 。 如 果 如 何 删除 集合 本 身 ， 可 以 像 删除 任何 Python 对 象 一 
样 ， 令 集合 超出 它 的 作用 范围 ， 或 调用 del 将 他 们 直接 清除 出 当前 的 名 称 空 间 。 如 果 它 的 引用 
计数 为 零 ， 也 会 被 标记 以 便 被 垃圾 回收 。 


>>> del s 


>>> 


7.7 集合 类 型 操作 符 


7.7.1 标准 类 型 操作 符 (所 有 的 集合 类 型 ) 
1， 成 员 关 系 (in, notin) 


就 序列 而 言 ，Python 中 的 in 和 not in 操作 符 决 定 菜 个 元 素 是 否 是 一 个 集合 中 的 成 员 。 


>>> s = set('cheeseshop') 


»»» t frozenset('bookshop') 
opo "a is 8 
False 
pa UE" 23 X 
True 
229. TEL SOE in t 
True 
2. 集合 等 价 /不 等 价 


等 价 /不 等 价 被 用 于 在 相同 或 不 同 的 集合 之 问 做 比较 。 两 个 集合 相等 是 指 ， 对 每 个 集合 而 言 ， 
当 且 仅 当 其 中 一 个 集合 中 的 每 个 成 员 同时 也 是 另 一 个 集合 中 的 成 员 。 


你 也 可 以 说 每 个 集合 必须 是 另 一 个 集合 的 一 个 子 集 ， 即 s< = tfes» = thti AA (True) 或 
(s<=tands> =t) 的 值 为 站 (True) 。 集 合 等 价 /不 等 价 与 集合 的 类 型 或 集合 成 员 的 顺序 无 
关 ， 只 与 集合 的 元 素 有 关 。 


>>> s == t 
False 


D xw ls 


True 

>>> u = frozenset(s) 
>>> S == u 

True 


>>> set('posh') == set('shop') 
True 
3. FRAR 


Set 用 Python 的 比较 操作 符 检 查 某 集合 是 否 是 其 他 集合 的 超 集 或 子 集 。" 小 于 "符号 (<> <=) 
用 来 判断 子 集 ，“ 大 于 "符号 (>，>=) 用 来 判断 超 集 。 


“小 于 ”和 “大 于 "意味 着 两 个 集合 在 比较 时 不 能 相等 。 等 于 号 允许 非 严 格 定义 的 子 集 和 超 集 。 


Set 支 持 严 格 (<) 子 集 和 非 严 格 (<=) 子 集 ， 也 支持 严格 (>) 超 集 和 非 严 格 (> =) 超 集 。 
只 有 当 第 1 个 集合 是 第 2 个 集合 的 严格 子 集 时 ， 我 们 才 称 第 1 个 集合 “小 于 "第 2 个 集合 ， 同 理 ， 只 
有 当 第 1 个 集合 是 第 2 个 集合 的 严格 超 集 时 ， 我 们 才 称 第 1 个 集合 “大 于 "第 2 个 集合 。 


>>> set('shop') < set('cheeseshop') 
True 
>>> set('bookshop') >= set('shop') 


True 


7.7.2 集合 类 型 操作 符 (所 有 的 集合 类 型 ) 
1. 联合 (p 


KA (union) 操作 和 集合 的 OR (又 称 可 兼 析 取 ，inclusive disjunction) 其 实 是 等 价 的 ， 两 个 
集合 的 联合 是 一 个 新 集合 ， 该 集合 中 的 每 个 元 素 都 至 少 是 其 中 一 个 集合 的 成 员 ， 即 ， 属 于 两 
个 集合 其 中 之 一 的 成 员 。 联 合 符号 有 一 个 等 价 的 方法 ，union() 。 


2B»» sS [Lc 
set(['c', "d^ Ve. "us UE. zou "ts "ts 
2. 交集 (8) 


你 可 以 把 交集 操作 比 做 集合 的 AND (RER) 操作 。 两 个 集合 的 交集 是 一 个 新 集合 ， 该 集合 
中 的 每 个 元 素 同时 是 两 个 集合 中 的 成 员 ， 即 属于 两 个 集合 的 成 员 。 交 集 符号 有 一 个 等 价 的 方 
法 ，intersection()。 


Pon € Bb tL 
Bet (tt th, ta" "gt, wt] 
3. 差 补 /相对 补 集 (-) 


两 个 集合 (sfet) 的 差 补 或 相对 补 集 是 指 一 个 集合 C， 该 集合 中 的 元 素 ， 只 属于 集合 Ss， 而 不 
属于 集合 t。 差 符号 有 一 个 等 价 的 方法 ，difference() 。 


> Ss-t 
set(Il'e', e") 


4. 对 称 差 分 (^) 


和 其 他 的 布尔 集合 操作 相似 ， 对 称 差 分 是 集合 的 XOR (又 称 " 异 或 "，exclusive 

disjunction) ° AARS (st) 的 对 称 差 分 是 指 另外 一 个 集合 C， 该 集合 中 的 元 素 ， 只 能 是 
属于 集合 s 或 者 集合 t 的 成 员 ， 不 能 同时 属于 两 个 集合 。 对 称 差 分 有 一 个 等 价 的 方法 ， 
symmetric_difference() ° 


上 面 的 示例 中 
所 产生 的 仍然 


,左边 的 S 是 可 变 集合 ， 而 右边 的 t 是 一 个 不 可 变 集合 ， 注 意 上 面 使 用 集合 操作 符 
是 可 变 集 合 ， 但 是 如 果 左 右 操作 数 的 顺序 反 过 来 ， 结 果 就 不 一 样 了 : 

> | s 

Lrosaengseri[*e', ^B, "qq", ho oy Ou Dp Saul) 

2290 $ ^04 

frosensét(['c', 'B', Se EN 

»»t-s 


frozenset(['k', 'b']) 


如 果 左 右 两 个 操作 数 的 类 型 相同 ， 既 都 是 可 变 集合 或 不 可 变 集合 ， 则 所 产生 的 结果 类 型 是 相 
同 的 ， 但 如 果 左 右 两 个 操作 数 的 类 型 不 相同 ( 左 操作 数 是 set， 右 操作 数 是 frozenset， 或 相反 
情况 ) ， 则 所 产生 的 结果 类 型 与 左 操作 数 的 类 型 相同 ， 上 例 中 可 以 证 明 这 一 点 。 还 要 注意 ， 
加 号 不 是 集合 类 型 的 操作 符 : 


»os yum o - 4 € 

Traceback (most recent call last): 

File "«stdin»", line 1, in ? 

TypeError: unsupported operand type(s) for *: 'set' and 
'set' 

2o» w-sS |t 

>>> v 

Nétil'o s, THs oe UNS UR V f. tet. utl. 


»»» len(v) 


7.7.3 ”集合 类 型 操作 符 〈 仅 适用 于 可 变 集 合 ) 
(Union) Update (|=) 


这 个 更 新 方法 从 已 存在 的 集合 中 添加 (可 能 多 个 ) 成 员 ， 此 方法 和 update() 等 价 


>>> S = set('cheeseshop') 
>>> u = frozenset(s) 

>>> s |= set('pypi') 

»»» 8s | 


set(['c', "ats. Ju "ht "a", "m "m 'y']) 
Retention/Intersection Update (& =) 


保留 (或 交集 更 新 ) 操作 保留 与 其 他 集合 的 共有 成 员 。 此 方法 和 intersection_update() 等 价 。 
>>> S = set(u) 
>>> S &= set('shop') 
>>> S 
setti mr, dg 1T Eu kc xr 


Difference Update (-=) 


N 
Co 
C2 


对 集合 s 和 t 进 行 差 更 新 操作 Ss-=t， 差 更 新 操作 会 返回 一 个 集合 ， 该 集合 中 的 成 员 是 集合 s 去 除 
掉 集 合 t 中 元 素 后 剩余 的 元 素 。 此 方法 和 difference_update() 等 价 。 


>>> s = set(u) 
>>> s -= set('shop"') 
^s» SB 
etl. | 
Symmetric Difference Update (^=) 


对 集合 s 和 t 进 行 对 称 差分 更 新 操作 (^t) ， 对 称 差分 更 新 操作 会 返回 一 个 集合 ， 该 集合 中 的 
成 员 仅 是 原 集 合 s 或 仅 是 另 一 集合 t 中 的 成 员 。 此 方法 和 symmetric_difference_update() 等 价 。 


> set (u) 


5» * frozenset('bookshop') 
>>> gg ^e t 
>>> S 


wi en '5', 'a', SE) 


7.8 PERSA 


7.8.1 EXA AA 
len() 


把 集合 作为 参数 传递 给 内 建 函 数 len()， 返 回 集合 的 基数 (或 元 素 的 个 数 ) 。 


>>> s = set(u) 

>>> S 

SEEL['B', h Tut, UNU, "t t'en 
>>> len(s) 

6 


7.8.2 ”集合 类 型 工厂 函数 
set() 和 frozenset() 


set() 和 frozenset() 工 厂 函 数 分 别 用 来 生成 可 变 和 不 可 变 的 集合 。 如 果 不 提供 任何 参数 ， 默 认 会 
生成 空 集 合 。 如 果 提 供 一 个 参数 ， 则 该 参数 必须 是 可 和 迭代 的 ， 即 一 个 序列 ， 或 迭代 器 ， 或 支 
持 和 迭代 的 一 个 对 象 ， 例 如 一 个 文件 或 一 个 字典 。 


>>> set() 

set([1) 

$052. SEL(LIJ 

set([1) 

>>> set(()) 

set([]) 

>>> set('shop') 

BeETI'M', "Me Ws "PN 


22» 
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>>> frozenset(['foo', 'bar']) 
frozenset(['foo', 'bar']) 

>>> 

>>> f = open('numbers', 'w') 
>>> for i in range(5): 

sia f.write('9&dWMn' $ i) 


>>> f.close() 
>>> f = open('numbers', 'r') 
>>> set(f) 


Sl OND: TOM EXT TANE CNM 


»»» f.close() 


7.9 集合 类 型 内 建 方法 
7.9.4 方法 (所 有 的 集合 方法 ) 


我 们 己 看 到 很 多 和 内 建 方 法 等 价 的 操作 符 ， 表 7.4 做 了 小 结 : 


内 建 方法 copy() 没 有 等 价 的 操作 符 。 和 同名 的 字典 方法 一 样 ，copy() 方 法 比 用 像 set()、 


frozenset() 或 dict() 这 样 的 工厂 方法 复制 对 象 的 副本 要 快 。 








&74 
EET » on 
—— sli 如 果 s 是 + 的 子 剑 ， 则 返回 True， 否 则 反问 False 
3 X3 s issaperset(i) In Cb s 的 超 集 ， 刘 返回 Tue， 埋 则 返回 False 
s.union(t) Umm 
s intersection(t) EHAKE, I TUTTI! 
s.difference(t) 返回 一 个 新 集合 ， 访 集合 是 s 的 成 员 ， 但 不 是 + 的 成 员 
a 返回 一 个 新 集合 ， 该 集合 是 # 或 4 的 成 员 ， 但 不 是 % 和 (共有 的 成 
seopy() "Terror 


7.9.2 方法 ( 仅 适 用 于 可 变 集合 ) 


表 7.5 总 结 了 所 有 可 变 集 合 的 内 建 方法 ， 和 上 面 的 方法 相似 ， 我 们 已 经 看 过 许多 和 它们 等 价 的 


操作 符 。 
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37.5 
H Egg » ft 
s.update(!) 用 + 中 的 元 素 修改 即 ，* 现 在 包含 * 或 t 的 成 员 
sntensection vodetet) | bii BART s 和 + 的 元 素 
s.difference update(t) s Pau D IENCT s 但 不 包含 在 ! 中 的 元 案 
s.symmetric difference update(t) s "PO LUC BONS NEUE ILICE s Rip., MFE s 和 + 共有 的 元 党 
s.add(obj) 在 集合 5s 中 添加 对 象 obj 
a samet nt obj; MR obj 不 是 集会 $s 中 的 元 素 (obj not in s), #312 


续 表 






如 果 obj Mfr s PETRO MMC s PRIR obj 
Heka s 中 的 任意 一 个 对 银 ， 间 返回 它 
BRE rs 中 的 所 在 元 类 


















新 的 方法 有 add()、remove()、discard()、pop()、clear()。 这 些 接受 对 象 的 方法 ， 参 数 必须 是 
可 哈 希 的 。 


7.9.3 操作 符 和 内 建 方法 比较 

像 你 看 到 的 ， 很 多 内 建 的 方法 几乎 和 操作 符 等 价 。 我 们 说 “几乎 等 价 ”， 意 思 是 它们 间 是 有 一 个 
重要 区 别 : 当 用 操作 符 时 ， 操 作 符 两 边 的 操作 数 必 须 是 集合 。 在 使 用 内 建 方法 时 ， 对 象 也 可 
以 是 迭代 类 型 的 。 为 什么 要 用 这 种 方式 来 实现 呢 ? Python 的 文档 里 写 明 : KA Z5 1$ 63 

set (‘abc’) intersection (‘cbs’) 可 以 避免 使 用 set (‘abc’) [and] ‘cbs’ 这 样 容易 出 错 的 构建 方 
法 。 

7.10 ”集合 类 型 总 结 表 


表 7.6 中 ， 我 们 总 结 了 所 有 的 集合 类 型 的 操作 符 、 遂 数 和 方法 。 
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表 7.6 
TIT | wen | w 明 
所 有 集合 类 型 
lenis) | [frio Ses roit 
mm | VERAT Wh aj DACIA. dia PECIA. BN 
indici | | FRANI IM ANIKA a Q7THUR. SIEHT 
| eis —— | 成 员 测 试 ，otj Ms ilh coe? 
| objnotins | PRM: obj RA sif tuc? 
| s= | 等 价 测试 : 测试 和 + 是 否 及 有 相同 的 元 素 ? 
| sm | 不 等 价 测试 : 与 一 相反 
| | 站 义 上 ) TAM stt BH s 中 所 有 的 元 素 都 是 t 的 成 
sissubsct(t) | | 子玉 测试 《多 洗 不 严格 意义 上 的 子 集 ) ;中 所 有 的 元 素 帮 是 + 的 成 员 
| soto [ (2 格 塌 义 上 ) 超 集 测试 stet 而 且 t 中 所 有 的 元 素 都 是 :的 成 
sissuperset(t) | sont [ 起 集 测试 《允许 不 严格 意义 上 的 超 集 ) ;+ 中 所 有 的 元 素 氟 是 s 的 成 员 
sunion(t) | oso [fs 或 + 中 的 元 素 
sintersee. tion(!) | se |ZARA 
s difference(t) | set [ ERME: s 中 的 元 素 ， 再 不 是 + 中 的 元 表 
ssymmetic difference) | — s^t | MEOEAHMES s 或 t 中 的 元 案 ， 但 不 是 s 和 + 共有 的 元 素 
copy | (AMR iles fo RMM BA 
续 表 
函数 /方法 名 | sene 说 用 
仅 用 于 可 变 集合 
s.opdate(t) sit (Union) 修改 摘 作 : e PARE s 
intemection update() — | — s&-t — | 交集 修改 失 作 ，s 中 仅 包 括 s 和 t 中 共有 的 大 员 
s-difference update(t) | set (ADAR: ePIRGIT S RURICE CR 
ssymmewie difference updset) | — s^-t | 对 称 六 分 外 改换 作 ，s 中 包括 仅 属于 s 或 仅 属于 + 的 成 员 
s add(obj) 加 到 


s.remove(obj) | [tiers seo 从 中 开除 ; 如果 s 中 不 存在 oj， 将 引发 KeyEmor 


sdiscardtobj) | moe0 的 友好 版 本 一 如果 * HE obj. Ms PINE 
spop0 | Pop 挫 作 ， 移 徐 并 返回 中 的 任意 一 个 元 业 
sclea() | [ 清 验 所 作 ， 移 除 中 的 所 有 元 来 


7.11 48 X2 


集合 (set) 模块 从 2.3 版 本 引进 ， 可 继承 Set 或 ImmuteablSet 来 生成 子 类 。 虽 然 从 Python2.4 起 


使 用 集合 类 型 ， 但 是 集合 模块 不 会 弃 用 。 

以 下 是 一 些 你 可 能 认为 有 用 的 在 线 参考 文章 : 
http://en.wikipedia.org/wiki/Set 
http://www.geocities.com/basicmathsets/set.html 


http://www.math.uah.edu/stat/foundations/Sets.xhtml 


um, 
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7.12 练习 


7-1. 字 典 方法 。 哪 个 字典 方法 可 以 用 来 把 两 个 字典 合并 到 一 起 ? 


7-2. 字 典 的 键 。 我 们 知道 字典 的 值 可 以 是 任意 的 Python 对 象 ， 那 字典 的 键 又 如 何 呢 ? 请 
试 着 将 除数 字 和 字符 串 以 外 的 其 他 不 同类 型 的 对 象 作 为 字典 的 键 ， 看 一 看 哪些 类 型 可 
以 ， 哪 些 不 行 ? 对 那些 不 能 作 字 典 的 键 的 对 象 类 型 ， 你 认为 是 什么 原因 呢 ? 
7-3. 字 典 和 列表 的 方法 。 
(a) 创建 一 个 字典 ， 并 把 这 个 字典 中 的 键 按照 字母 顺序 显示 出 来 。 
(b) 现在 根据 已 按照 字母 顺序 排序 好 的 键 ， 显 示 出 这 个 字典 中 的 键 和 值 。 
(c) Fl (b) ， 但 这 次 是 根据 已 按照 字母 顺序 排序 好 的 字典 的 值 ， 显示 出 这 个 字典 
中 的 键 和 值 (注意 : 对 字典 和 哈 希 表 来 说 ， 这 样 做 一 般 没有 什么 实际 意义 ， 因 为 大 
多 数 访问 和 排序 (如果 需 要 ) 都 是 基于 字典 的 键 ， 这 里 只 把 它 作为 一 个 练习 ) 。 
7-4. 建 立 字 典 。 给 定 两 个 长 度 相同 的 列表 ， 比 如 说 ， 列 表 [1，2，3，...] 和 
[abc，'def，'ghi'，.…]， 用 这 两 个 列表 里 的 所 有 数据 组 成 一 个 字典 ， 像 这 样 : 
{1 : ‘abe’ > 2 : ‘def > 3 : ‘ghi’ > ...) 
7-5.userpw2.py。 下 面 的 问题 和 例题 7.1 中 管理 名 字 - 密 码 的 键 值 对 数据 的 程序 有 关 。 
(a) 修改 那个 脚本 ， 使 它 能 记录 用 户 上 次 的 登录 日 期 和 时 间 (用 time 模 块 ) ， 并 与 
用 户 密码 一 起 保存 起 来 。 程 序 的 界面 有 要 求 用 户 输入 用 户 名 和 密码 的 提示 。 无 论 户 
名 是 否 成 功 登 录 ， 都 应 有 提示 ， 在 户 名 成 功 登 录 后 ， 应 更 新 相应 用 户 的 上 次 登录 时 
间 戳 。 如 果 本 次 登录 与 上 次 登录 在 时 间 上 相差 不 超过 4 个 小 时 ， 则 通知 该 用 户 :“You 


already logged in at : «last login_timestamp>。 


(b) 添加 一 个 “管理 "菜单 ， 其 中 有 以 下 两 项 : (1) 删除 一 个 用 户 (2) 显示 系统 中 
所 有 用 户 的 名 字 和 他 们 的 密码 的 清单 。 


(c) 口令 目前 没有 加 密 。 请 添加 一 段 对 口令 加 密 的 代码 (请 参考 crypt、rotor， 或 
其 他 加 密 模块 ) 。 


(d) 为 程序 添加 图 形 界面 ， 例 如 ， 用 Tkinter 写 。 
(e) 要 求 用 户 名 不 区 分 大 小 写 。 
(D 加 强 对 用 户 名 的 限制 ， 不 允许 符号 和 空白 符 。 


(g) 合并 “新 用 户 " 和 “ 老 用 户 " 两 个 选项 。 如 果 一 个 新 用 户 试图 用 一 个 不 存在 的 用 户 
名 登录 ， 询 问 该 用 户 是 否 是 新 用 户 ， 如 果 回 答 是 肯定 的 ， 就 创建 该 账户 。 否 则 ， 按 
照 老 用 户 的 方式 登录 。 
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7-6. 列 表 和 字典 。 创 建 一 个 简单 的 股票 证 券 投资 数据 系统 。 其 中 应 至 少 包 含 4 项 数据 : 股 
市 行情 显示 器 符号 、 所 持 有 的 股票 、 购 买 价格 及 当前 价位 你 可 以 随意 派 加 其 他 数据 
项 ， 比 如 收益 这，52 周 最 高 指数 、 最 低 指数 ， 等 等 。 
用 户 每 次 输入 各 列 的 数据 构成 一 个 输出 行 。 每 行 数据 构成 一 个 列表 。 还 有 一 个 总 列 
表 ， 包 括 了 所 有 行 的 数据 。 数 据 输 入 完毕 后 ， 提 示 用 户 选 择 一 列 数据 项 进行 排序 。 
把 该 数据 项 抽取 出 来 作为 字典 的 键 ， 字 典 的 值 就 是 该 键 对 应 行 的 值 的 列表 。 提 醒 读 
者 : 被 选择 用 来 排序 的 数据 项 必须 是 非 重复 的 键 ， 否 则 就 会 丢失 数据 ， 因 为 字典 不 
允许 一 个 键 有 多 个 值 。 
你 还 可 以 选择 其 他 计算 输出 ， 比 如 盈亏 比率 、 目 前 证 券 资产 价值 等 。 


7-7. 颠 倒 字 典 中 的 键 和 值 。 用 一 个 字典 做 输入 ， 输 出 另 一 个 字典 ， 用 前 者 的 键 做 值 ， 前 者 
的 值 做 键 。 


7-8. 人 力 资源 。 创 建 一 个 简单 的 雇员 姓名 和 编号 的 程序 ， 让 用 户 输入 一 组 雇员 姓名 和 编 
号 。 你 的 程序 可 以 提供 按照 姓名 排序 输出 的 功能 ， 雇 员 姓 名 显示 在 前 面 ， 后 面 是 对 应 的 
雇员 编号 。 附 加 题 : 添加 一 项 功能 ， 按 照 雇员 编号 的 顺序 输出 数据 。 


7-9. 翻 译 。 


(a) 编写 一 个 字符 翻译 程序 (功能 类 似 于 Unix 中 的 tr 命令 ) 。 我 们 将 这 个 函数 叫做 
tr()， 它 有 三 个 字符 串 做 参数 : 源 字符 囊 、 目 的 字符 囊 、 基 本 字符 囊 ， 语 法 定义 如 
EE 


def tr(srcstr, dststr, string) 
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srcstr 的 内 容 是 你 打算 “翻译 "的 字符 集合 ，dsrstr 是 翻译 后 得 到 的 字符 集合 ， 而 string 
是 你 打算 进行 翻译 操作 的 字符 串 。 举 例 来 说 ， 如 果 srcstr=='abc'…，dststr=='mno' * 
string=='abcdef， 那 么 tr() 的 输出 将 是 "mnodef。 注 意 这 里 len (srcstr) 

--len (dststr) 。 


在 这 个 练习 里 ， 你 可 以 使 用 内 建 函 数 chr() 和 ord()， 但 它们 并 不 一 定 是 解决 这 个 问题 
所 必 不 可 少 的 函数 。 


(b) 在 这 个 函数 里 增加 一 个 标志 参数 ， 来 处 理 不 区 分 大 小 写 的 翻译 问题 。 


(c) 修改 你 的 程序 ， 使 它 能 够 处 理 删除 字符 的 操作 。 字 符 串 srcstr 中 不 能 够 映射 到 
字符 串 dststr 中 字符 的 多 余 字 符 都 将 被 过 滤 掉 。 换 钨 话说， 这 些 字符 没有 映射 到 

dststr 字 符 串 中 的 任何 字符 ， 因 此 就 从 函数 返回 的 字符 里 被 过 滤 掉 了 。 举 例 来 说 : 如 
果 srcstr=='abcdef , dststr=='mno’, string=='abcdefghi， 那 么 tr() 将 输出 "mnoghi。 注 


意 这 里 len (srcstr) >=len (dststr) 。 
7-10.29 & ° 


(a) 用 上 一 个 练习 的 思路 编写 一 个 “rot13” 翻 译 器 。“rot13” 是 一 个 古老 而 又 简单 的 加 
密 方 法 ， 它 把 字母 表 中 的 每 个 字母 用 其 后 的 第 13 个 字母 来 代替 。 字 母 表 中 前 半 部 分 
字母 将 被 映像 到 后 半 部 分 ， 而 后 半 部 分 字母 将 被 映像 到 前 半 部 分 ， 大 小 写 保 持 不 
变 。 举 例 来 说 ，'a' 将 被 蔡 换 为 'n"X' 将 被 葵 换 为 'K' ; 数字 和 符号 不 进行 翻译 。 


(b) 在 你 的 解决 方案 的 基础 上 加 一 个 应 用 程序 ， 让 它 提示 用 户 输入 准备 加 密 的 字符 
$ (这 个 算法 同时 也 可 以 对 加 密 后 的 字符 囊 进行 解密 ) ， 如 下 所 示 : 


* rotl3.py 

Enter string to rotl3: This is a short sentence. 

Your string to en/decrypt was: [This is a short sentence.]. 
The rot13 string is: [Guvf vf n fubeg fragrapr.]. 
$ 
% rotl3.py 
Enter string to rotl3: Guvf vf n fubeg fragrapr. 
Your string to en/decrypt was: [Guvf vf n fubeg fragrapr.]. 
The rotl3 string is: [This is a short sentence.]. 
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7-11. 定 义 。 什 么 组 成 字典 中 合法 的 键 ? 了 举例 说 明 字典 中 合法 的 键 和 非法 的 键 。 
7-12. 定 义 。 (a) 在 数学 上 ， 什 么 是 集合 ? 
(b) 在 Python 中 ， 关 于 集合 类 型 的 定义 是 什么 了 


7-13. 随 机 数 。 修 改 练习 5-17 的 代码 ， 使 用 random 模 块 中 的 randint() 或 randrange() 方 法 生 
成 一 个 随机 数 集合 ， 从 0 到 9 (包括 9) 中 随机 选择 ， 生 成 1~10 个 随机 数 。 这 些 数字 组 成 
集合 A (A 可 以 是 可 变 集合 ， 也 可 以 不 是 ) 。 同 理 ， 按 此 方法 生成 集合 B。 每 次 新 生成 集 
合 A 和 B 后 ， 显 示 结果 A|B 和 A&B 。 


7-14. 用 户 验证 。 修 改 前 面 的 练习 ， 要 求 用 户 输入 A|B 和 A&B 的 结果 ， 并 告诉 用 户 他 (或 
她 ) 的 答案 是 否 正确 ， 而 不 是 将 AIB 和 A&B 的 结果 直接 显示 出 来 。 如 果 用 户 回 答 错 误 ， 多 
许 他 (或 她 ) 修改 解决 方案 ， 然 后 重新 验证 用 户 输入 的 答案 。 如 果 用 户 三 次 提交 的 答案 
均 不 正确 ， 程 序 将 显示 正确 结果 。 附 加 题 : 运用 你 关于 集合 的 知识 ， 创 建 某 个 集合 的 潜 
在 子 集 ， 并 询问 用 户 此 潜在 子 集 是 否 丨 是 该 集合 的 子 集 ， 要求 和 主 程序 一 样 有 显示 更 正 
和 答案 的 功能 。 


7-15. 编 写 计 算 器 。 这 个 练习 取材 于 http://math.hws.edu/ 在 线 免费 Java 教 材 中 的 练习 
12.2。 编 写 一 个 程序 允许 用 户 选 择 两 个 集合 : A 和 B， 及 运算 操作 符 。 例 如 ，in、notin、 
&、|、^、<、<=、>、>=、==、! = 等。 (你 自己 定义 集合 的 输入 语法 ， 它 们 并 不 一 定 
要 像 Java 示 例 中 那样 用 方 括号 括 住 。) 解析 输入 的 字符 串 ， 按 照 用 户 选择 的 运算 进行 操 
作 。 你 写 的 程序 代码 应 该 比 Java 该 程序 的 版 本 更 简洁 。 
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本 章 主题 
e -if 语 句 


+ -elsei$ 4] 

* -elifià 4j 

e -条 件 表 达 式 

+ -whileis 4] 

€ - for 语句 

+ -breaki& 4] 

* -continuet 4] 
+ -passié 4 

* elsei&é] (两 次 述 及 ) 
+ lteratorsiX 4X 55 
+ -列表 解析 

e -生成 器 表达 式 


本 章 的 主要 内 容 是 Python 的 条 件 和 循环 语句 以 及 与 它们 相关 的 部 分 。 我 们 会 深入 探讨 ff、 
while ` for A 5 4&1] 18435 fe 8 else ` elif ^ break ` continue?" passi? 4] » 


8.1 ifi$ 5 
Python 中 的 if 子 句 看 起 来 十 分 熟悉 。 它 由 三 部 分 组 成 : 关键 字 本 身 ， 用 于 判断 结果 芙 假 的 条 件 
表达 式 ， 以 及 当 表 达 式 为 真 或 者 非 零 时 执行 的 代码 块 。if 语 多 的 语法 如 下 : 

if expression: 


expr true suite 


if 语 多 的 expr_true_suite 代 码 块 只 有 在 条 件 表 达 式 的 结果 的 布尔 值 为 真 时 才 执 行 ， 否 则 将 继续 
执行 紧 跟 在 该 代码 块 后 面 的 语句 。 


8.1.1 多 重 条 件 表 达 式 


单个 i 语 名 可 以 通过 使 用 布尔 操作 符 and、or 和 not 实 现 多 重 判断 条 件 或 是 否定 判断 条 件 。 


if not warn and (system load >= 10): 
print "WARNING: losing resources" 


warn += 1 


8.1.2 单一 语句 的 代码 块 


如 果 一 个 复合 语句 (例如 if 子 名 ，while 或 for 循 环 ) 的 代码 块 仅仅 包含 一 行 代 码 ， 那 么 它 可 以 
和 前 面 的 语句 写 在 同一 行 上 : 


if make hard copy: send data to printer() 


上 边 这样 的 单行 语句 是 合法 的 ， 尽 管 它 可 能 方便 ， 但 这 样 会 使 得 代码 更 难 阅读 ， 所 以 我 们 推 
着 将 这 行 代码 移 到 下 一 行 并 合理 地 缩 进 。 另 外 一 个 原因 就 是 如 果 你 需要 添加 新 的 代码 ， 你 还 
是 得 把 它 移 到 下 一 行 。 


8.2 ”else 语句 


和 其 他 语言 一 样 ，Python 提 供 了 与 放 语 句 搭配 使 用 的 else 语 句 。 如 果 if 语 句 的 条 件 表达 式 的 结 
果 布 尔 值 为 假 ， 那 么 程序 将 执行 else 语 句 后 的 代码 。 它 的 语法 你 甚至 可 以 猜 到 : 


if expression: 
expr true suite 
else: 


expr false suite 


这 里 是 样 例 代码 : 


if passwd -- user.passwd: 


ret str = "password accepted" 
id = user.id 


valid = True 


ret str - "invalid password entered... try again!" 


valid = False 


避免 "悬挂 else” 

Python 使 用 缩 进 而 不 是 用 大 括号 标记 代码 块 边界 的 设计 ， 不 仅 帮 助 强化 了 代码 的 正确 性 ， 而 
且 还 暗中 帮助 程序 员 避 免 了 语法 上 正确 的 代码 中 存在 潜在 的 问题 。 其 中 一 个 问题 就 是 ( 自 
Z) 昭著 的 “ 巧 挂 else”(dangling else) 问题 ， 一 种 语义 错觉 。 


我 们 在 这 里 给 出 一 段 C 代 码 来 说 明 我 们 的 例子 (K&R 和 其 他 的 编程 教材 也 给 出 过 ) (这 里 的 
K&R 是 指 由 Brian W. Kernighan 和 Dennis M. Ritchie 合 闭 的 《C 程 序 设计 语言 》， 译 者 注 ) 


/*C 语言 中 的 悬挂 else*/ 
if (balance > 0.00) 
if (((balance ~ amt) > min bal) && (atm cashout() == 1)) 
printf("Here's your cash; please take all bills.Mn"); 
else 
printf("Your balance is zero or negative.Mn"); 


问题 是 else 属 于 哪个 f? 在 C 语 言 中 ， 规 则 是 else 与 最 近 的 if 搭配 。 所 以 我 们 上 面 的 例子 中 ， 
else 虽 然 是 想 和 外 层 的 if 搭配 ， 但 是 事实 上 else 属 于 内 部 的 并 ， 因 为 C 编 译 器 会 忽略 额外 的 空 
白 。 结 果 ， 如 果 你 的 balance 是 正 数 但 小 于 最 小 值 ， 你 将 得 到 错误 的 输出 ， 程 序 会 显示 你 的 
balance 是 零 或 者 为 负数 。 
由 于 这 个 例子 很 简单 ， 所 以 解决 这 个 问题 并 不 难 ， 但 是 如 果 是 大 块 的 代码 紫 入 到 了 类 似 这 样 
的 框架 中 ， 那 么 发 现 并 改正 程序 中 的 错误 需要 耗费 很 多 精力 。Python 设 置 的 护栏 不 仅 阻 止 你 
掉 下 悬崖 ， 而 且 会 带 你 离开 危险 的 境地 。 在 Python 中 相同 的 例子 对 应 如 下 的 两 种 代码 《只 有 
一 种 是 正确 的 ) 

if balance > 0.00: 

if balance - amt » min bal and atm cashout(): 
print "Here's your cash; please take all bills." 


else: 


print 'Your balance is zero or negative.' 


或 者 是 : 


if balance » 0.00: 
if balance - amt » min bal and atm cashout(): 
print "Here's your cash; please take all bills." 


else: 


print 'Your balance is zero or negative. 


Python 的 缩 进 使 用 强制 使 代码 正确 对 齐 ， 让 程序 员 来 决定 else 属 于 哪 一 个 f。 限 制 你 的 选择 从 
而 减少 了 不 确定 性 ，Python 鼓 励 你 第 一 次 就 写 出 正确 的 代码 。 在 Python 中 制造 出 "悬挂 else” 问 
题 是 不 可 能 的 。 而 有 全 ， 由 于 不 再 使 用 大 括号 ，Python 代 码 变 得 更 易 读 懂 。 


8.3 elif (Fp else-if) 语句 


elifzz PythonfJelse-ifi& 4] > CHES 4 AR ACE 6 o ETERNA EARE Hc 88 4X 
码 。 和 Else 一 样 ，elif 声 明 是 可 选 的 ， 然 而 不 同 的 是 ，if 语 句 后 最 多 只 能 有 一 个 else 语 句 ， 但 可 
以 有 任意 数量 的 elif 语 句 。 


if expressionl: 


exprl true suite 


elif expression2: 
expr2 true suite 
elif expressionN: 
exprN true suite 
else: 


none of the above suite 


switch/casei& 6] 8 4; 4X do 4 ? 


在 将 来 的 某 天 ，Python 可 能 会 支持 switch/case 语 句 ， 但 是 你 完全 可 以 用 其 他 的 Python 结构 来 
模拟 它 。 在 Python 中 ， 大 量 的 if-elif 语 句 并 不 难 阅读 : 


if user.cmd == 'create': 


action = "create item" 


elif user.cmd -- 'delete': 
action = 'delete item' 
elif user.cmd == 'update': 
action = 'update item' 
else: 
action = 'invalid choice... try again!' 


上 面 的 语句 完全 可 以 满足 我 们 的 需要 ， 不 过 我 们 还 可 以 用 序列 和 成 员 关 系 操作 符 来 简化 它 : 


if user.cmd in ('create', 'delete', 'update'): 


action * '$s item' * user.cmd 
else: 
action * 'invalid choice... try again!' 


另外 我 们 可 以 用 Python 字典 给 出 更 加 优雅 的 解决 方案 ， 我 们 将 在 第 7 章 中 介绍 字典 。 


msgs = ('create': 'create item', 
'delete': '"'delete item', 
'update': "'update item') 
default = 'invalid choice... try again!' 
action - msgs.get(user.cmd, default) 


众所周知 ， 使 用 映射 对 象 〈 比 如 字典 ) 的 一 个 最 大 好 处 就 是 它 的 搜索 操作 比 类 似 ielif-else 语 
名 或 是 for 循 环 这 样 的 序列 查询 要 快 很 多 。 


8.4 条件 表达 式 ( 即 “三 元 操作 符 ”) 


如 果 你 来 自 C/IC++ 或 者 是 Java 世 界 ， 那 么 你 很 难 忽略 的 一 个 事实 就 是 Python 在 很 长 的 一 段 时 
间 里 没有 条 件 表 达 式 (C? X : Y) ， 或 称 三 元 操作 符 。 (C 是 条 件 表达 式 ; X 是 C 为 True 时 的 
结果 ，Y 是 C 为 False 时 的 结果 ) Guido Van Rossum 一 直 拒 绝 加 入 这 样 的 功能 ， 因 为 他 认为 应 
该 保持 代码 简单 ， 让 程序 员 不 轻易 出 错 。 不 过 在 十 年 多 后 ， 他 放弃 了 ， 主 要 是 因为 人 们 试 着 


用 and 和 or 来 模拟 它 ， 但 大 多 都 是 错误 的 。 根 据 《FAQ》， 正 确 的 方法 (并 不 唯一 ) X (C 
and[X]or[Y]) [0] 。 唯 一 的 问题 是 社区 不 同意 这 样 的 语法 。 (你 可 以 看 一 看 PEP 308， 其 中 有 
不 同 的 方案 ) 。 对 于 Python 的 这 一 问题 ， 人 们 表达 了 极 大 的 诉求 。 


Guido Van Rossum 最 终 选 择 了 一 个 最 被 看 好 (也 是 他 最 喜欢 ) 的 方案 ， 然 后 把 它 运用 于 标准 
库 中 的 一 些 模 块 。 根 据 PEP，“ 这 个 评审 通过 考察 大 量 现 实 世 界 的 案例 ， 包 含 不 同 的 应 用 ， 以 
及 由 不 同 程序 员 完 成 的 代码 。" 最 后 Python2.5 集 成 的 语法 确定 为 : X if C else Y » 


有 了 三 元 操作 符 后 你 就 只 需要 一 行 完成 条 件 判 断 和 赋值 操作 ， 而 不 需要 像 下 面 例子 中 的 min() 
那样 ， 使 用 和 -else 语 名 实现 对 数字 Xx 和 y 的 操作 : 


>>> X, y = d, 3 
S) GE x € y" 

—Ó smaller = x 
... else: 


kd smaller = y 


>>> smaller 


在 2.5 以 前 的 版 本 中 ，Python 程 序 员 最 多 这 样 做 (其 实 是 一 个 hack， 译 者 注 ) : 


>>> smaller = (x < y and [x] or [y]) [0] 
>>> smaller 


3 
在 2.5 和 更 新 的 版 本 中 ， 你 可 以 使 用 更 简明 的 条 件 表 达 式 : 


>>> smaller = x if x < y else y 
>>> smaller 


3 


8.5 while 4] 


Python 的 while 是 本 章 我 们 遇 到 的 第 一 个 循环 语句 。 事 实 它 上 是 一 个 条 件 循环 语句 。 与 if 声 明 相 
比 ， 如 果 if 后 的 条 件 为 真 ， 就 会 执行 一 次 相应 的 代码 块 。 而 while 中 的 代码 块 会 一 直 循 环 执行 ， 
B 5| AXE AER Re 
8.5.4 一 般 语 法 


while 循 环 的 语法 如 下 : 


while expression: 
suite to repeat 


While 循环 的 suite to repeat-- 4] 4 — i& /& 3-341 * E flexpression/á 75 7p mI » 3x $e AE 2E Kg 
循环 机 制 常 常用 在 计数 循环 中 ， 请 参见 下 节 中 例子 。 


8.5.2 ”计数 循环 


Count = 0 

while(count<9) : 
print'the index is:',count 
count + = 1 


ik W 05 4X4 3 Y. EA T printfe A 238 6] » CMRE X 4T » i SIcount T9 » X 21count 
在 每 次 迭代 时 被 打印 出 来 然后 自 增 1。 如 果 在 Python 解释 器 中 输入 这 些 代码 我 们 将 得 到 这 样 的 
结果 : 


>>> count = 0 
>>> while (count < 9): 
iu print 'the index'is: ', count 


"x count += 1 


the index is: 
the index is: 
the index is: 


the index is: 


the index is: 
the index is: 


0 
I 
2 
3 
the index is: 4 
5 
6 
the index is: 7 
8 


the index is: 


8.5.3 无 限 循 环 


人 

不 会 结束 。 这 些 “ 无 限 ” 的 循环 不 一 定 是 坏事 ， 许 多 通讯 服务 器 的 客户 端 /服务 器 系统 就 是 通过 
它 来 工作 的 。 这 取决 于 循环 是 否 需 要 一 直 执 行 下 去 ， 如 果 不 是 ， 那 么 这 个 循环 是 否 会 结束 ; 
也 就 是 说 ， 条 件 表达 式 会 不 会 计算 后 得 到 布尔 假 ? 


while True: 
handle, indata = wait for client connect() 
outdata = process request (indata) 


ack result to client(handle, outdata) 


wo DM Zt False » 3X Xx 
为 服务 器 代码 是 用 来 等 待 客户 端 (可 能 通过 网 络 ) 来 连接 的 。 这 些 客户 端 o 


R 3 服务 器 处 理 请 求 


请 求 被 处 理 后 ， 服 务 器 将 向 客户 端 返回 数据 ， 而 此 时 客户 端 可 能 断 开 连接 或 是 发 送 另 一 个 请 
求 。 对 于 服务 器 而 言 它 已 经 完成 了 对 这 个 客户 端的 任务 ， 它 会 返回 最 外 层 循环 等 待 下 一 个 连 
接 。 在 第 16 章 和 第 17 章 里 你 将 了 解 关于 如 何 处 理 客户 端 /服务 器 的 更 多 信息 。 


8.6 fori$ 4 


Python 提供 给 我 们 的 另 一 个 循环 机 制 就 是 for 语 如。 它 提供 了 Python 中 最 强大 的 循环 结构 。 它 
可 以 遍历 序列 成 员 ， 可 以 用 在 列表 解析 和 生成 器 表达 式 中 ， 它 会 自动 地 调用 迭代 器 的 next() 方 
法 ， 捕 获 Stoplteration 异 常 并 结束 循环 〈 所 有 这 一 切 都 是 在 内 部 发 生 的 ) 。 如 果 你 刚刚 接触 
Python 那么 我 们 要 告诉 你 ， 在 以 后 你 会 经 常用 到 它 的 。 和 传统 语言 (例如 C/C++，Fortran ， 
或 者 Java) 中 的 for 语 名 不 同 ，Python 的 for 更 像 是 shell 或 是 脚本 语言 中 的 foreach 循 环 。 


8.6.1 一 般 语法 


for 循 环 会 访问 一 个 可 迭代 对 象 (例如 序列 或 是 迭代 器 ) 中 的 所 有 元 素 ， 并 在 所 有 条 目 都 处 理 
过 后 结束 循环 ， 它 的 语法 如 下 : 


for iter var in iterable: 


suite to repeat 


次 循环 ，iter_var 和 迭代 变量 被 设置 为 可 和 迭代 对 象 〈 序 列 、 和 迭代 器 或 其 他 支持 迭代 的 对 象 ) 的 
: 前 元 素 ， 提 供给 suite_ to repeati& 4] x f£ Jf] » 


8.602 ”用 于 序列 类 型 
本 节 中 ， 我 们 将 学 习 用 for 循 环 和 迭代 不 同 的 序列 对 象 。 样 例 将 涵盖 字符 串 、 列 表 及 元 组 。 


>>> for eachLetter in 'Names': 


print 'current letter: ', eachLetter 


current letter: N 
current letter: a 
current letter: m 
current letter: e 


current letter: s 


当 和 迭代 字符 串 时 ， 选 代 变量 只 会 包含 一 个 字符 〈 长 度 为 1 的 字符 串 ) 。 但 这 并 不 常用 。 在 字符 
串 里 中 查找 字符 时 ， 程 序 员 往 往 使 用 in 来 测试 成 员 关 系 ， 或 者 使 用 string 模 块 中 的 函数 以 及 字 
符 串 方法 来 检查 子 字符 串 。 

看 到 单个 的 字符 在 一 种 情况 下 有 用 ， 即 在 通过 print 语 多 调试 for 循 环 中 的 序列 时 ， 如 果 你 在 应 
该 看 到 字符 串 的 地 方 发 现 的 却 是 单个 的 字符 ， 那 么 很 有 可 能 你 接受 到 的 是 一 个 字符 串 ， 而 不 
是 对 象 的 序列 。 


迭代 序列 有 三 种 基本 方法 : 
1. 通过 序列 项 迭代 


>>> nameList = ['Walter', "Nicole", 'Steven', 'Henry'] 


>>> for eachName in nameList: 


print eachName, "Lim" 


Walter Lim 
Nicole Lim 
Steven Lim 
Henry Lim 
G^ MA 


在 上 面 的 例子 中 ， 我 们 迭代 一 个 列表 。 每 次 迭代 ，eacgName 变 量 都 被 设置 为 列表 中 特定 某 -4 
元 素 ， 然 后 我 们 在 代码 块 中 打印 出 这 个 变量 。 

2. 通过 序列 索引 迭代 

另 一 个 方法 就 是 通过 序列 的 索引 来 迭 


»»» nameList = ['Cathy', "Terry", 'Joe', 'Heather', 
'Lucy'] 
>>> for nameIndex in range(len(nameList)): 


print "Liu,", nameList[nameIndex] 


Liu, Cathy 
Liu, Terry 


Liu, Joe 


Liu, Heather 


Liu, Lücy 


我 们 没有 和 迭代 元 素 ， 而 是 通过 列表 的 索引 和 迭代 。 


这 里 我 们 使 用 了 内 建 的 len() 有 函数 获得 序列 长 度 ， 使 用 range() 函 数 〈 我 们 将 在 下 面 详细 讨论 
它 ) 创建 了 要 迭代 的 序列 。 


>>> len(nameList) 

5 

>>> range (len (nameList)) 
O 1. Z2, 3, 4] 


使 用 range() 我 们 可 以 得 到 用 来 迭代 nameList 的 索引 数列 表 ; 使 用 切片 /下 标 操 作 符 ([]) ， 就 
可 以 访问 对 应 的 序列 对 象 。 


oem 问 你 会 意识 到 直接 迭代 序列 要 比 通过 索引 和 迭代 快 。 
如 果 你 不 明白 ， 那 么 你 可 以 仔细 想 想 。 (参见 练习 8-13) 。 


3. 使 用 项 和 索引 和 迭代 
两 全 其 美的 办 法 是 使 用 内 建 的 enumerate() 有 函数 ， 它 是 Python 2.3 的 新 增 内 容 。 代 码 如 下 : 


>>> nameList = ['Donn', 'Shirley', 'Ben', 'Janice', 
'David', 'Yen', 'Wendy'] 
>>> for i, eachLee in enumerate (nameList): 


print "$d $s Lee" $ (i*1, eachLee) 


Donn Lee 
Shirley Lee 
Ben Lee 
Janice Lee 
David Lee 


Yen Lee 


J O Ui 4 t N B: 


Wendy Lee 


8.6.3 ”用 于 迭代 器 类 型 


用 for 循 环 访问 迭代 器 和 访问 序列 的 方法 差不多 。 唯 一 的 区 别 就 是 far 语句 会 为 你 做 一 些 额外 的 
事情 。 和 迭代 器 并 不 代表 循环 条 目的 集合 。 


和 迭代 器 对 象 有 一 个 next() 方 法 ， 调 用 后 返回 下 一 个 条 目 。 所 有 条 目 迭 代 完 后 ， 和 迭代 器 引发 一 个 
Stoplteration 异 常 告诉 程序 循环 结束 。for 语 名 在 内 部 调用 next() 并 捕获 异常 。 


使 用 迭代 器 做 for 循 环 的 代码 与 使 用 序列 条 目 几 乎 完全 相同 。 事 实 上 在 大 多 情况 下 ， 你 无 法 分 
辨 出 你 选 代 的 是 一 个 序列 还 是 迭代 器 ， ， 这 我 们 在 说 要 遍历 一 个 迭代 器 时 ， 
实际 上 可 能 我 们 指 的 是 要 遍历 一 个 序列 ， ， 或 是 一 个 支持 迭代 的 对 象 ( 它 有 next() 方 
ik) 。 


8.6.4 range() AE $% 
我 们 前 面 介 绍 Python 的 for 循 环 的 时 候 提 到 过 它 是 一 种 迭代 的 循环 机 制 。Python 同 样 提供 一 个 


工具 让 我 们 在 传统 的 伪 条 件 设置 下 使 用 for 声 明 ， 例 如 从 一 个 数字 开始 计数 到 另 一 个 数字 ， 一 
旦 到 达 最 后 的 数字 或 者 某 个 条 件 不 再 满足 就 立刻 退出 循环 。 


内 建 函 数 range() 可 以 把 类 似 foreach 的 for 循 环 变 成 你 更 加 熟悉 的 语句 。 例 如 从 0 到 10 计 数 ， 或 
者 从 10 到 100 一 次 递增 5。 


range() 的 完整 语法 
Python 提供 了 两 种 不 同 的 方法 来 调用 range()。 完 整 语法 要 求 提供 两 个 或 三 个 整 型 参数 : 
range(start, end, step -1) 
range() 会 返回 一 个 包含 所 有 k 的 列表 ， 这 里 start<= k < end， 从 start 到 end，k 每 次 递增 step。 
step 不 可 以 为 零 ， 否 则 将 发 生 错 误 。 
>>> range(2, 19, 3) 
LES Ss B; Aly, Jy LT] 
如 果 只 给 定 两 个 参数 ， 而 省 略 step，step 就 使 用 默认 值 1。 
> range(3, 7) 
[3, 4, 5, 6] 


我 们 来 看 看 解释 器 环境 下 的 例子 。 


»»» for eachVal in range(2, 19, 3): 


print "value is: ", eachVal 


value is: 2 
value is: 5 
value is: 8 
value is: 11 
value is: 14 


value is: 17 


我 们 的 循环 从 2 “ 数 " 到 19， 每 次 递增 3。 如 果 你 熟悉 C 的 话 ， 就 会 发 现 ，range() 的 参数 与 C 的 
for 循 环 变量 有 着 直接 的 关系 : 


/* equivalent loop in C */ 
for (eachVal = 2; eachVal < 19; eachVal *- 3) ( 
printf("value is: $dMn", eachVal); 


) 


虽然 看 起 来 像 是 一 个 条 件 循 环 (检查 eachVal<19) ， 但 实际 上 是 range() 先 用 我 们 指定 的 条 件 
生成 一 个 列表 ， 然 后 把 列表 用 于 这 个 for 语 名。 


range() 简 略语 法 


range() 还 有 两 种 简略 的 语法 格式 : 
range (end) 
range(start, end) 


我 们 在 第 2 章 看 到 过 最 短 的 语法 接受 一 个 值 ，start 默 认为 0，step 默 认为 1， 然 后 range() 返 回 从 
0 到 end 的 数列 。 


>>> range(5) 
[0， Ls 2 C» 4 ] 


ange Ou 中 型 版 本 和 完整 版 本 几乎 完全 一 样 ， 只 是 step 使 用 上 默认 值 {。 现 在 我 们 在 Python 解 释 
器 中 试 下 这 i X44: 


>>> for count in range(2, 5): 


print count 


>e 0 N 


核心 笔记 : 为 什么 range() 不 是 只 有 一 种 语法 ? 


你 已 经 知道 了 range() 的 所 有 语法 ， 有 些 人 可 能 会 问 一 个 挑 别 的 问题 ， 为 什么 不 把 这 两 种 语法 
合并 成 一 个 下 面 这 样 的 语法 ? 


range (start=0, end, step -1) # invalid 


这 个 语法 不 可 以 使 用 两 个 参数 调用 。 因 为 step 要 求 给 定 start。 换 句 话 说 ， 你 不 能 只 传递 end 和 
step 参 数 。 因 为 它们 会 被 解释 器 误 认为 是 start 和 end 。 


8.6.5 xrange()7i € žk 


xrange() 类 似 range()， 不 过 当 你 有 一 个 很 大 的 范围 列表 时 ，xrange() 可 能 更 为 适合 ， 因 为 它 不 
会 在 内 存 里 创建 列表 的 完整 拷贝 。 它 只 被 用 在 for 循 环 中 ， 在 for 循 环 外 使 用 它 没有 意义 。 同 样 
地 ， 你 可 以 想到 ， 它 的 性 能 远 高 Prange 因为 它 不 生成 整个 列表 。 在 Python 的 未 来 版 本 
中 ，range() 可 能 会 像 xrange() 一 样 ， 返 回 一 个 可 和 迭代 对 象 〈 不 是 列表 也 不 是 一 个 迭代 器 ) 。 


8.6.6 ”与 序列 相关 的 内 建 函 


sorted() ` reversed()  enumerate() ` zip() 


Python 核心 编程 第 二 版 


下 边 是 使 用 循环 相关 和 序列 相关 函数 的 例子 。 为 什么 它们 叫 " 序 列 相关 ? 呢 ? 是 因为 其 中 两 个 函 
数 (sorted()fezip()) 返回 一 个 序列 〈 列 表 ) ， 而 另外 两 个 函数 (reversed() 和 enumerate()) 
返回 迭代 器 〈 类 似 序 列 ) 。 


>>> albums = ('Poe', 'Gaudi', 'Freud', 'Poe2') 
>>> years = (1976, 1987, 1990, 2003) 
>>> for album in sorted(albums): 


print album, 


Freud Gaudi Poe Poe2 
>>> 
>>> for album in reversed(albums): 


print album, 


Poe2 Freud Gaudi Poe 
>>> 
>>> for i, album in enumerate (albums): 


print i, album 


0 Poe 

1 Gaudi 

2 Freud 

3 Poe2 

>>> 

>>> for album, yr in zip(albums, years): 


print yr, album 


第 8 章 ”条 件 和 循环 


1976 Poe 
1987 Gaudi 
1990 Freud 
2003 Poe2 


我 们 已 经 涵盖 了 Python 中 的 所 有 循环 语句 ， 下 面 我 们 看 看 循环 相关 的 语句 ， 包 括 用 于 放弃 循 
环 的 break 语 句 和 立即 开始 下 一 次 迭代 的 continue 语 句 。 


8.7 breakié 4] 


Python 中 的 break 语 句 可 以 结束 当前 循环 然后 跳 转 到 下 条 语句 ， 类 似 C 中 的 传统 break。 常 用 在 
当 茶 个 外 部 条 件 被 触发 (一 般 通 过 if 语 名 检查 ) ， 需 要 立即 从 循环 中 退出 时 break 语 句 可 以 用 
在 while 和 for 循 环 中 。 


count = num / 2 


while count > 0: 


if num $ count == 0: 
print count, 'is the largest factor of', num 
break 

count -= 1 


o m 数 。 我 们 和 迭代 所 有 可 能 的 约 数 ，count 变 量 依次 
递减 ， 第 一 个 能 整除 num 的 就 是 我 们 要 找 的 最 大 约 数 ， 找 到 后 就 不 再 继续 找 了 ， 使 用 break 语 
Pc 


phone2remove = '555-1212' 
for eachPhcne in phoneList: 
if eachPhone == phone2remove: 
print "found", phone2remove, '... deleting' 
deleteFromPhoneDB (phone2remove) 


break 


这 里 的 break 语 句 用 于 打 断 列表 的 迭代 ， 目 的 是 为 了 找到 列表 中 的 目标 元 素 ， 如 果 找 到 ， 则 把 
它 从 数据 库 里 删除 然后 退出 循环 。 


8.8 continuei 4 


核心 笔记 : continueis 4] 


不 管 是 对 Python 、C、Java， 还 是 其 他 任何 支持 continue 语 名 的 结构 化 语言 ， 一 些 初学 者 有 这 
样 的 一 个 误解 : continue 语 多 “立即 启动 循环 的 下 一 次 迭代 ”。 实 际 上 ， 当 遇 到 continuei 4 

时 ， 程 序 会 终止 当前 循环 ， 并 忽略 剩余 的 语 多 ， 然 后 回 到 循环 的 顶端 。 在 开始 下 一 次 迭代 
前 ， 如 果 是 条 件 循环 ， 我 们 将 验证 条 件 表 达 式 ; 如 果 是 迭代 循环 ， 我 们 将 验证 是 否 还 有 元 素 
可 以 从 代 。 只 有 在 验证 成 功 的 情况 下 ， 我 们 才 会 开始 下 一 次 迭代 。 


Python 里 的 continue 语 句 和 其 他 高 级 语言 中 的 传统 continue 并 没有 什么 不 同 。 它 可 以 被 用 在 
While 和 for 循 环 里 。Wwhile 循 环 是 条 件 性 的 ， 而 for 循 环 是 迭代 的 ， 所 以 continue 在 开始 下 一 次 循 
环 前 要 满足 一 些 先 决 条 件 (前 边 的 核心 笔记 中 强调 的 ) ， 和 否则 循环 会 正常 结束 。 


valid False 
count = 3 
while count > O0: 
input = raw input("enter password") 
# check for valid passwd 
for eachPasswd in passwdList: 
if input -- eachPasswd: 


valid = True 


break 
if not valid: # (or valid == 0) 
print "invalid input" 
count -- 1 
continue 


else: 


break 


这 里 例子 结合 使 用 了 while、for、if、break 和 continue， 用 来 验证 用 户 输入 。 用 户 有 三 次 机 会 
来 输入 正确 的 密码 ， 如 果 失 败 ， 那 么 valid 变 量 将 仍 为 一 个 布尔 假 (0) ， 然 后 我 们 可 以 采取 必 
要 的 操作 阻止 用 户 猜 测 密码 。 


8.9 pass“ 


Python 还 提供 了 pass 语 句 (C 中 没有 提供 对 应 的 语句 ) 。Python 没 有 使 用 传统 的 大 括号 来 标 
记 代码 块 ， 有时， 有 些 地 方 在 语法 上 要 求 要 有 代码 ， 而 Python 中 没有 对 应 的 空 大 括号 或 是 分 
号 (;) 来 表示 C 语 言 中 的 “不 做 任何 事 "， 如 果 你 在 需要 在 有 语句 块 的 地 方 不 写 任何 语句 ， 解 释 
器 会 提示 你 语法 错误 。 因 此 ，Python 提 供 了 pass 语 句 ， 它 不 做 任何 事情 一 一 即 NOP， (No 
OPeration， 无 操作 ) 我 们 从 汇编 语言 中 借用 这 个 概念 。pass 同 样 也 可 作为 开发 中 的 小 技巧 ， 
标记 你 后 来 要 完成 的 代码 ， 例 如 这 样 : 





def foo func(): 


pass 


或 者 


if user choice -- 'do calc': 
pass 
else: 


pass 


这 样 的 代码 结构 在 开发 和 调试 时 很 有 用 ， 因 为 编写 代码 的 时 候 你 可 能 要 先 把 结构 定 下 来 ， 但 
你 不 希望 它 干扰 其 他 已 经 完成 的 代码 。 在 不 需要 它 做 任何 事情 地 方 ， 放 一 个 pass 将 是 一 个 很 
好 的 主意 。 


另外 它 在 异常 处 理 中 也 被 经 常用 到 ， 我 们 将 在 第 10 章 中 详细 介绍 ; 比如 你 跟踪 到 了 一 个 非 致 
命 的 错误 ， 不 想 采 取 任 何 措施 (只 是 想 记 录 一 下 事件 或 是 在 内 部 进行 处 理 轩 了 ) o 


8.10 ”再 谈 else 语 句 


EC (以 及 大 多 其 他 语言 中 ) ， 你 不 会 在 条 件 语句 范围 外 发 现 else 语 句 ， 但 Python 不 同 ， 你 可 
以 在 while 和 for 循 环 中 使 用 else 语 句 。 它 们 是 怎么 工作 的 呢 ? 在 循环 中 使 用 时 ，else 子 名 只 在 
循环 完成 后 执行 ， 也 就 是 说 break 语 句 也 会 跳 过 else 块 。 


展示 While 语 句 中 else 用 法 的 一 个 例子 就 是 寻找 一 个 数 的 最 大 约 数 。 我 们 已 经 实现 了 完成 这 个 
任务 的 函数 ， 使 用 while 循 环 和 else 语 句 。 例 8.1 (maxFact.py) 利用 这 个 语法 完成 了 
showMaxFactor() £i x. ° 


158.1 while-else4& 3:284] (maxFact.py) 


1 $!/usr/bin/env python 

2 

3 def showMaxFactor (num): 

4 count = num / 2 

5 while count » 1: 

6 if num $ count == 0: 

7 print 'largest factor of $d is $d' $% \ 
8 (num, count) 

9 break 

10 count -= 1 

11 else: 

12 print num, "is prime" 
13 


14 for eachNum in range (10, 21): 


15 showMaxFactor (eachNum) 
这 个 程序 显示 出 10~20 中 的 数字 的 最 大 约 数 。 该 脚本 也 会 提示 这 个 数 是 否 为 素数 。 


showMaxFactor() 驾 数 中 第 3 行 的 循环 从 amount 的 一 半 开 始 计数 (这 样 就 可 以 检查 这 个 数 是 否 
可 以 被 2 整除 ， 如 果 可 以 ， 那 就 找到 了 最 大 的 约 数 ) 。 然 后 循环 每 次 递减 1 (第 10 行 )， 直 到 
发 现 约 数 (第 6~9 行 ) 。 如 果 循 环 递减 到 1 还 没有 找到 约 数 ， 那 么 这 个 数 一 定 是 素数 。11~12 
行 的 else 子 名 负责 处 理 这 样 的 情况 。 程 序 的 主体 〈14~15 行 ) 用 数字 参数 调用 
showMaxFactor()。 执 行 该 程序 将 得 到 这 样 的 输出 : 
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Fh 


largest factor of 10 is 5 


1l is prime 


rh 


largest factor of 12 is 6 
13 is prime 


1s 7 
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largest factor o 
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largest factor o 1s 5 


Fh 
rn 
OY 


largest factor o is B 


17 is prime 


Fh 


largest factor of 18 is 9 
19 is prime 


largest factor of 20 is 10 


同样 地 ，for 循 环 也 可 以 有 else 用 于 循环 后 处 理 〈post-processing) 。 它 和 while 循 环 中 的 else 
' else 子 句 就 会 执行 。 我 们 在 


处 理 方式 相同 。 只 要 for 循 环 是 正常 结束 的 (不 是 通过 break) 


8.5.3 已 经 见 过 这 样 的 例子 。 








3 8.1 条 件 及 循环 语句 中 的 辅助 语句 总 结 
a" 辅助 语句 
循环 和 条 件 请 名 , 
&— [ — we | is 
eif ， laf SENEC 了 | 
cise . | 
break [N ŇA 
continue [Le | 
pass" [| | 


a. pass 在 任何 需要 语句 据 (一 个 识 多 个 语 甸 ) 的 地 方 都 可 以 使 用 《例如 elif. else. clasa, def. try. except Fi finally ) 。 


a. pass 在 任何 需要 语句 块 (一 个 或 多 个 语句 ) 的 地 方 都 可 以 使 用 (例如 elif、elif、clasa、 


def ` try、except 和 finally) ° 


8.11 


迭代 器 和 iter() 函 数 


8.11.1 什么 是 迭代 器 


条 件 和 循环 


312 


迭代 器 是 在 版 本 2.2 被 加 入 Python 的 ， 它 为 类 序列 对 象 提供 了 一 个 类 序列 的 接口 。 我 们 在 前 边 
的 第 6 章 已 经 正式 地 介绍 过 序列 。 它 们 是 一 组 数据 结构 ， 你 可 以 利用 它们 的 索引 从 0 开始 一 
站“ 迭代 ”到 序列 的 最 后 一 个 条 目 。 用 “计数 ”的 方法 迭代 序列 是 很 简单 的 。Python 的 迭代 无 颖 地 
支持 序列 对 象 ， 而 且 它 还 允许 程序 员 和 迭代 非 序 列 类 型 ， 包 括 用 户 定义 的 对 象 。 


迭代 器 用 起 来 很 灵巧 ， 你 可 以 迭代 不 是 序列 但 表现 出 序列 行为 的 对 象 ， 例 如 字典 的 键 、 一 个 
文件 的 行 ， 等 等 ， 当 你 使 用 循环 选 代 一 个 对 象 条 目 时 ， 你 几乎 分 辨 不 出 它 是 选 代 器 还 是 序 
列 。 你 不 必 去 关注 这 些 ， 因 为 Python 让 它 像 一 个 序列 那样 操作 。 
8.11.2 为 什么 要 迭代 器 
引用 PEP (234) 中 对 和 迭代 器 的 定义 : 

e 提供 了 可 扩展 的 迭代 器 接口 ; 

e 对 列表 迭代 带 来 了 性 能 上 的 增强 ; 

e 在 字典 迭代 中 性 能 提升 ; 

e 创建 监 正 的 述 代 接口 ， 而 不 是 原来 的 随机 对 象 访问 ; 

e 与 所 有 已 经 存在 的 用 户 定义 的 类 以 及 扩展 的 模拟 序列 和 映射 的 对 象 向 后 兼容 ; 


e 迭代 非 序列 集合 (例如 映射 和 文件 ) 时 ， 可 以 创建 更 简洁 可 读 的 代码 。 


8.11.3 如何 迭代 


根本 上 说 ， 和 迭代 器 就 是 有 一 个 next() 方 法 的 对 象 ， 而 不 是 通过 索引 来 计数 。 当 你 或 是 一 个 循环 
机 制 (例如 for 语 句 ) 需要 下 一 个 项 时 ， 调 用 迭代 器 的 next() 方 法 就 可 以 获得 它 。 条 目 全 部 取出 
后 ， 会 引发 一 个 Stoplteration 异 常 ， 这 并 不 表示 错误 发 生 ， 只 是 告诉 外 部 调用 者 ， 选 代 完成 。 
过 ， 和 迭代 器 也 有 一 些 限 制 。 例 如 你 不 能 向 后 移动 ， 不 能 回 到 开始 ， 也 不 能 复制 一 个 先 代 

如 果 你 要 再 次 〈 或 者 是 同时 ) 迭代 同 个 对 象 ， 你 只 能 去 创建 另 一 个 迭代 器 对 象 。 不 过 ， 
这 并 不 糟糕 ， 因 为 还 有 其 他 的 工具 来 帮助 你 使 用 述 代 器 。 


WR CA 


reversed() 内 建 函 数 将 返回 一 个 反 序 访问 的 选 代 器 。enumerate() 内 建 函 数 同样 也 返回 迭代 

器 。 另 外 两 个 新 的 内 建 函 数 ，any() 和 all()， 是 在 Python 2.5 中 新 增 的 ， 如 果 迁 代 器 中 某 个 /所 
有 条 目的 值 都 为 布尔 真 时 ， 则 它们 返回 值 为 大。 本 章 先 前 部 分 我 们 展示 了 如 何在 for 循 环 中 通 
过 索引 或 是 可 和 迭代 对 象 来 遍历 条 目 。 同 时 Python 还 提供 了 一 整个 itertools 模 块 ， 它 包含 各 种 有 
用 的 迭代 器 。 


8.11.4 使 用 和 迭代 器 


1. 序列 
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正如 先前 提 到 的 ， 和 迭代 Python 的 序列 对 象 和 你 想像 的 一 样 : 
>>> myTuple = (123, 'xyz', 45.67) 
>>> i = iter(myTuple) 
>>> i.next() 
L23 
>>> i.next() 
'xyz' 
>>> i.next() 
45.67 
2»» i.next() 
Traceback (most recent call last): 
Elle "". 3206 21. in * 
StopIteration 
如 果 这 是 一 个 实际 应 用 程序 ， 那 么 我 们 需要 把 代码 放 在 一 个 try-except 块 中 。 序 列 现在 会 自动 
地 产生 它们 自己 的 迭代 器 ， 所 以 一 个 for 循 环 : 
for i in seq: 


do something to(i) 


under the covers now really behaves like this: 


实际 上 是 这 样 工作 的 : 
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fetch = iter(seq) 


while True: 


i = fetch.next () 
except StopIteration: 
break 


do something to(i) 


不 过 ， 你 不 需要 改动 你 的 代码 ， 因 为 for 循 环 会 自动 调用 迭代 器 的 next() 方 法 (以 及 监视 
StoplterationJt 3$ ) ° 


2. T 


典 和 文件 是 另外 两 个 可 和 迭代 的 Python 数据 类 型 。 字 典 的 迭代 器 会 遍历 它 的 键 (key) » #4 
for P in myDict.keys() T 4 2 5 77 for eachKey in myDict， 例 如 : 


>>> legends = ( ('Poe', 'author'): (1809, 1849, 1976) 
('Gaudi', 'architect'): (1852, 1906, 1987), 
('Freud', 'psychoanalyst'): (1856, 1939, 1990) 


>>> for eachLegend in legends: 
print 'Name: $sNtOccupation: $s' $ eachLegend 
print ' Birth: $sWMtDeath: $s\tAlbum: $sMn' \ 
% legends[eachLegend] 


Name: Freud Occupation: psychoanalyst 
Birth: 1856 Death: 1939 Album: 1990 


Name: Poe Occupation: author 
Birth: 1809 Death: 1849 Album: 1976 


Name: Gaudi Occupation: architect 
Birth: 1852 Death: 1906 Album: 1987 


另外 ，Python 还 引进 了 三 个 新 的 内 建 字典 方法 来 定义 迭代 : myDictiterkeys() (通过 键 迭 
代 ) ` myDict.itervalues() (通过 值 迭 代 ) iteritems() (38 3t 4£-4A RAR) 。 注 
意 ，in 操 作 符 也 可 以 用 于 检查 字典 的 键 是 否 存在 ， 之 前 的 布尔 表达 式 
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KE on 


myDict.has key (anyKey) 可 以 被 简写 为 anyKey in myDict 。 
3. 文件 


文件 对 象 生 成 的 选 代 器 会 自动 调用 readline() 方 法 。 这 样 ， 循 环 就 可 以 访问 文本 文件 的 所 有 
行 。 程 序 员 可 以 使 用 更 简单 的 for eachLine in myFile 替 换 for eachLine in myFile.readlines() : 


>>> myFile = open('config-win.txt') 
>>> for eachLine in myFile: 


print eachLine, # comma suppresses extra Mn 


[EditorWindow] 
font-name: courier new 
font-size: 10 


>>> myFile.close() 


8.11.5  *" T Ze GANE 


记 住 ， 在 迭代 可 变 对 象 的 时 候 修改 它们 并 不 是 个 好 主意 。 这 在 迭代 器 出 现 之 前 就 是 一 个 问 
题 。 一 个 流行 的 例子 就 是 循环 列表 的 时 候 删 除 满足 (或 不 满足 ) 特定 条 件 的 项 : 
for eachURL in allURLs: 
if not eachURL.startswith('http: //'): 
allURLs.remove(eacnhURL) # YIKES!! 
除 列 表 外 的 其 他 序列 都 是 不 可 变 的 ， 所 以 危险 就 发 生 在 这 里 。 一 个 序列 的 迭代 器 只 是 记录 你 
当前 到 达 第 多 少 个 元 素 ， 所 以 如 果 你 在 和 迭代 时 改变 了 元 素 ， 更 新 会 立即 反映 到 你 所 和 迭代 的 条 
目 上 。 在 选 代 字典 的 键 时 ， 你 绝对 不 能 改变 这 个 字典 。 使 用 字典 的 keys() 方 法 是 可 以 的 ， 因 为 
keys() 返 回 一 个 独立 于 字典 的 列表 。 而 迭代 器 是 与 实际 对 象 绑 定 在 一 起 的 ， 它 将 不 会 继续 执行 
TE: 
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>>> for eachKey in myDict: 


>>> myDict = ('a': 1, 


rint eachKey, myDict[eachKey] 
y y 


del myDict[eachKey] 


a l 
Traceback (most recent call last): 
File "". Jine 1; in f 


RuntimeError: dictionary changed size during iteration 


这 样 可 以 避免 有 缺陷 的 代码 。 更 多 有 关 和 迭代 器 的 细节 请 参阅 PEP 234 。 


8.11.6 ”如 何 创建 迭代 器 


对 一 个 对 象 调用 iter() 就 可 以 得 到 它 的 迭代 器 。 它 的 语法 如 下 : 


iter (obj) 


iter(func, sentinel ) 


如 果 你 传递 一 个 参数 给 iter()， 它 会 检查 你 传递 的 是 不 是 一 个 序列 ， 如 果 是 ， 那 么 很 简单 : 根 
据 索 引 从 0 一 直 迭 代 到 序列 结束 。 另 一 个 创建 过 代 器 的 方法 是 使 用 类 ， 我 们 将 在 第 13 章 详细 介 
绍 ， 一 个 实现 了 ijter() 和 next() 方 法 的 类 可 以 作为 移 代 器 使 用 。 


如 果 是 传递 两 个 参数 给 iter()， 它 会 重复 地 调用 func， 直 到 和 迭代 器 的 下 个 值 等 于 sentinel。 


8.12 列表 解析 


列表 解析 (List comprehensions， 或 缩 略 为 list comps) 来 自 函 数 式 编程 语言 Haskell。 它 是 一 
个 非常 有 用 、 简 单 而且 灵 活 的 工具 ， 可 以 用 来 动态 地 创建 列表 。 它 在 Python 2.0 中 被 加 入 。 


在 第 11 章 中 ， 我 们 将 讨论 Python 早 就 支持 的 函数 式 编程 特性 ， 例 如 lambda、map() 和 filter() 
等 ， 它 们 存在 于 Python 中 已 经 很 长 时 间 了 ， 但 通过 列表 解析 ， 它 们 可 以 被 简化 为 一 个 列表 解 
析 式 子 。map() 对 所 有 的 列表 成 员 应 用 一 个 操作 ，filter() 基 于 一 个 条 件 表达 式 过 滤 列 表 成 员 。 
最 后 ，lambda 允 许 你 快速 地 创建 只 有 一 行 的 函数 对 象 。 你 不 需要 现在 就 去 掌握 这 些 ， 在 本 节 
中 你 将 看 到 它们 出 现在 例子 里 ， 因 为 我 们 需要 讨论 列表 解析 的 优势 。 首 先 让 我 们 看 看 列表 解 
析 的 语法 : 


[expr for iter var in iterable] 


这 个 语句 的 核心 是 for 循 环 ， 它 和 迭代 iterable 对 象 的 所 有 条 目 。 前 边 的 expr 应 用 于 序列 的 每 个 成 
员 ， 最 后 的 结果 值 是 该 表达 式 产 生 的 列表 。 和 迭代 变量 并 不 需要 是 表达 式 的 一 部 分 。 这 里 用 到 
了 第 11 章 的 一 些 代码 。 它 有 一 个 计算 序列 成 员 的 平方 的 lambda 函 数 表 达 式 : 


>>> map(lambda x: x ** 2, range(6)) 
[0, 1, 4, 9, 16, 25] 


我 们 可 以 使 用 下 面 这 样 的 列表 解析 来 替换 它 : 


>>> [x ** 2 for x in range (606)) 
Loy 1, 4, 9, l6, 25] 


在 新 语 多 中 ， 只 有 一 次 函数 调用 〈range()) ， 而 先前 的 语句 中 有 三 次 函数 调用 (range()、 
map() 和 lambda) 。 你 也 可 以 用 括号 包 住 表达 式 ， 像 [ (x*2) forxin range (6) ] 这 样 ， 更 便 
于 阅读 。 列 表 解 析 的 表达 式 可 以 取代 内 建 的 map() 函 数 以 及 lambda， 而 且 效 率 更 高 。 结 合 if 语 


多， 列表 解析 还 提供 了 一 个 扩展 版 本 的 语法 : 
[expr for iter var in iterable if cond expr] 


这 个 语法 在 迭代 时 会 过 滤 或 “捕获 ?满足 条 件 表 达 式 Cond_expr 的 序列 成 员 。 


回想 一 下 odd() 函 数 ， 它 用 于 判断 一 个 数值 对 象 是 奇数 还 是 偶数 〈 奇 数 返回 1， 偶 数 返 回 0 ) 


def odd(n): 


return n $% 2 


我 们 可 以 借用 这 个 函数 的 核心 操作 ， 使 用 flter() 和 lambda 挑 选 出 序列 中 的 奇数 : 


i5». gag - [11, 10,.9, 9, 10, 10, 9, 8, 23, 9, T7, 18, 12, 11, 121 
filter(lambda x: x , Seq) 
[1 , 9 3, 9, bar J 7 


和 先前 的 例子 一 样 ， 即 使 不 用 filter() 和 lambda， 我 们 同样 可 以 使 用 列表 解析 来 完成 操作 ， 获 得 
想 要 的 数字 : 


>>> [x for x in seq if x * 2] 
[L1, 9, €, S, 23y 39, Jy LL] 
我 们 使 用 更 多 实用 的 例子 结束 这 节 。 
1. AEREHP 


A E Je 3E AN — 18 34157] 89 4E E A 72 AR] : 


>>> [(x*l,y*1l) for x in range(3) for y in range(5) 
[6L,. 394. ths Z2), UL. 3E, 4l, Wy UL, 2k,4 UR dye AWeex«x Q5 
3), (2, 4). (2, S59), I3»; 1), (35. 2); (9, 3), 413, 4), i$ 3)] 


2. 磁盘 文件 样 例 
假设 我 们 有 如 下 这 样 一 个 数据 文件 hhga.txt， 需 要 计算 出 所 有 非 空白 字符 的 数目 : 


And the Lord spake, saying, "First shalt thou take out the Holy Pin. Then shalt thou count to 
three, no more, no less. Three shall be the number thou shalt count, and the number of the 
counting shall be three. Four shalt thou not count, neither count thou two, excepting that 


thou then proceed to three. Five is right out. Once the number three, being the third number, 
be reached, then lobbest thou thy Holy Hand Grenade of Antioch towards thy foe, who, 
being naughty in My sight, shall snuff it." 


o s. & for line in data3& AX x £F P] 9 Rit 这 个 ， 我 们 还 可 以 把 每 行 分 
3| (split) 为 单词 ， 然 后 我 们 可 以 像 这 样 计 算 单词 个 数 : 


>>> f = open('hhga.txt', 'r') 
>>> len([word for line in f for word in line.split()]) 


A 


2l 


快速 地 计算 文件 大 小 


import os 
>>> os.stat('hhga.txt').st size 
499L 


假定 文件 中 至 少 有 一 个 室 白 字符 ， 我 们 知道 文件 中 有 少 于 499 个 非 空 字符 。 我 们 可 以 把 每 个 单 
词 的 长 度 加 起 来 ， 得 到 和 。 


> sum((len(word) for line in f for word in line.split()]) 
408 


à € 4&1 seek()sdt El 5| 34-343, ^ ELLEN CURE LOT LEAMA o — Pp] 

了 的 列表 解析 完成 了 之 前 需要 许多 行 代码 能 完成 的 工作 ! 如 你 所 见 ， 列 表 解析 支持 多 重 贮 

套 for 循 环 以 及 多 个 if 子 句 。 完 整 的 语法 可 以 在 官方 文档 中 找到 。 你 也 可 以 在 PEP 202 中 找到 更 
多 关于 列表 解析 的 资料 。 


8.13 ”生成 器 表达 式 


生成 器 表达 式 是 列表 解析 的 一 个 扩展 。 在 Python 2.0 中 我 们 加 入 了 列表 解析 ， 使 语言 有 了 一 次 
革命 化 的 发 展 ， 提 供给 用 户 了 一 个 强大 的 工具 ， 只 用 一 行 代码 就 可 以 创建 包含 特定 内 容 的 列 
表 。 你 可 以 去 问 一 个 有 多 年 Python 经 验 的 程序 员 是 什么 改变 了 他 们 编写 Python 程序 的 方式 ， 
那么 得 到 最 多 的 答案 一 定 会 是 列表 解析 。 


另 一 个 在 Python 版 本 2.2 时 被 加 入 的 重要 特性 是 生成 器 。 生 成 器 是 特定 的 函数 ， 人 允许 你 返 
个 值 ， 然 后 "暂停 "代码 的 执行 ， 稍 后 恢复 。 我 们 将 在 第 11 章 中 讨论 生成 器 。 


d m 用 以 创建 整个 列表 。 这 可 能 对 有 大 量 数据 的 
器 有 负面 效应 。 生 成 器 表达 式 通过 结合 列表 解析 和 生成 器 解决 了 这 个 问题 。 


生成 器 表达 式 在 Python 2.4 被 引入 ， 它 与 列表 解析 非常 相似 ， 而 且 它 们 的 基本 语法 基本 相同 ; 
不 过 它 并 不 丨 正 创建 数字 列表 ， 而 是 返回 一 个 生成 器 ， 这 个 生成 器 在 每 次 计算 出 一 个 条 目 

后 ， 把 这 个 条 目 “ 产 生 ”(yield) 出 来 。 生 成 器 表达 式 使 用 了 “延迟 计算 ”(lazy evaluation) > 
所 以 它 在 使 用 内 存 上 更 有 效 。 我 们 来 看 看 它 和 列表 解析 到 底 有 多 相似 : 


列表 解析 : 


[expr for iter var in iterable if cond expr] 


生成 器 表达 式 : 


(expr for iter var in iterable if cond expr) 


生成 器 并 不 会 让 列表 解析 废弃 ， 它 只 是 一 个 内 存 使 用 更 友好 的 结构 ， 基 于 此 ， 有 很 多 使 用 生 
成 器 地 方 。 下 面 我 们 提供 了 一 些 使 用 生成 器 表达 式 的 例子 ， 最 后 举 一 个 兄长 的 样 例 ， 从 它 你 
可 以 感觉 到 Python 代码 在 这 些 年 来 的 变化 。 
1. 磁盘 文件 样 例 
在 前 边 列表 解析 一 节 ， 我 们 计算 文本 文件 中 非 空 字符 总 和 。 最 后 的 代码 中 ， 我 们 展示 了 如 何 
使 用 一 行列 表 解 析 代 码 做 所 有 的 事 。 如 果 这 个 文件 的 大 小 变 得 很 大 ， 那 么 这 行 代码 的 内 存 性 
能 会 很 低 ， 因 为 我 们 要 创建 一 个 很 长 的 列表 用 于 存放 单词 的 长 度 。 
为 了 避免 创建 庞大 的 列表 ， 我 们 可 以 使 用 生成 器 表达 式 来 完成 求 和 操作 。 它 会 计算 每 个 单词 
的 长 度 然后 传递 给 sum() 函 数 ( 它 的 参数 不 仅 可 以 是 列表 ， 还 可 以 是 可 迭代 对 象 ， 比 如 生成 器 
RAN) 。 这 样 ， 我 们 可 以 得 到 优化 后 的 代码 (代码 长 度 ， 还 有 执行 效率 都 很 高 效 ) 
>>> sum(len(word) for line in data for word in line.split()) 
408 
我 们 所 做 的 只 是 把 方 括号 删除 : 少 了 两 字 节 ， 而 且 更 节省 内 存 ... 非 常 地 环保 ! 
2. 交叉 配对 样 例 
生成 器 表达 式 就 好 像 是 懒 情 的 列表 解析 (这 反而 成 了 它 主 要 的 优势 ) 。 它 还 可 以 用 来 处 理 其 
他 列表 或 生成 器 ， 例 如 这 里 的 rows 和 cols : 

rows = [1, 2, 3, 17] 


def cols(): # example of simple generator 
yield 56 
yield 2 
yield 1 


不 需要 创建 新 的 列表 ， 直 接 就 可 以 创建 配对 。 我 们 可 以 使 用 下 面 的 生成 器 表达 式 : 


x product pairs (tt; 3) for i in rows for j in cols()) 
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现在 我 们 可 以 循环 X_product_pairs， 它 会 懒惰 地 循环 rows 和 cols : 


> 
print pair 

(1, 56) 

(1, 2) 

Uu 

(2, 56) 

(2, 2) 

(2, 1) 

(3. 96] 

(3, 2) 

(Jy 1) 

(17, 56) 

(17, 2) 

GT. T 


3. 重 构 样 例 


我 们 通过 一 个 寻找 文件 最 长 的 行 的 例子 来 看 看 如 何 改进 代码 。 在 以 前 ， 我 们 这 样 读 取 文件 : 


f = open('/etc/motd', 'r') 
longest = 0 | 
while True: 
linelen = len(f.readline().strip()) 
if not linelen: break 
if linelen > longest: 
longest = linelen 
f.close() 


return longest 


事实 上 ， 这 还 不 够 老 。 真 正 的 理 版 本 Python 代码 中 ， 布 尔 常量 应 该 写 是 整 型 1， 而 且 我 们 应 该 


使 用 string 模 块 而 不 是 字符 囊 的 strip() 方 法 : 
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一 
一 
oO 
) 


import string 


len(string.strip(f.readline())) 
FEMME do Qu QU M 么 应 该 尽早 释放 文件 资源 。 如 果 这 是 一 个 很 
进程 都 要 用 到 的 日 志文 件 ， 那 么 ww n 拿 着 它 的 句柄 不 释放 。 是 的 ， 我 们 
HET REC. 但 是 你 应 该 得 到 这 个 理念 。 所 以 读 取 文 件 的 行 的 首选 方法 应 该 是 这 
样 : 
f = open('/etc/motd', 'r') 
longest = 0 
allLines = f.readlines() 
f.close() 
for line in allLines: 
linelen = len(line.strip()) 
if linelen > longest: 
longest = linelen 
return longest 


列表 解析 允许 我 们 稍微 简化 代码 ， 而 且 我 们 可 以 在 得 到 行 的 集合 前 做 一 定 的 处 理 。 在 下 段 代 
码 中 ， 除 了 读 取 文件 中 的 行 之 外 ， 我 们 还 调用 了 字符 串 的 strip() 方 法 处 理 行内 容 。 


f = open('/etc/motd', 'r') 
longest = 0 
allLines = f.readlines () 
f.close|() 
for line in allLines: 
linelen = len(line.strip()) 
if linelen > longest: 
longest = linelen 


return longest 


然而 ， 两 个 例子 在 处 理 大 文件 时 候 都 有 问题 ， 因 为 readlines() 会 读 取 文件 的 所 有 行 。 后 来 我 们 
有 了 和 迭代 器 ， 文 件 本 身 就 成 为 了 它 自己 的 迭代 器 ， 不 需要 调用 readlines() 函 数 。 我 们 已 经 做 到 
了 这 一 步 ， 为 什么 不 去 直接 获得 行 长 度 的 集合 呢 (之 前 我 们 得 到 的 是 行 的 集合 ) ? 这 样 ， 我 
们 就 可 以 使 用 max() 内 建 函 数 得 到 最 长 的 字符 串 长 度 : 


f = open('/etc/motd', 'r') 
allLineLens = [len(x.strip()) for x in f] 


f.close() 


return max(allLineLens) 


这 里 唯一 的 问题 就 是 你 一 行 一 行 和 迭代 {f 的 时 候 ， 列 表 解 析 需 要 文件 的 所 有 行 读 取 到 内 存 中 ， 然 
后 生成 列表 。 我 们 可 以 进一步 简化 代码 : 使 用 生成 器 表达 式 替换 列表 解析 ， 然 后 把 它 移 到 
max() 函 数 里 ， 这 样 ， 所 有 的 核心 部 分 只 有 一 行 : 

f = open('/etc/motd', 'r') 

longest = max(len(x.strip()) for x in f) 

f.close() 

return longest 


xcu dedu qu cum T RS AERE IRSUHON D e 
然 ， 文 件 用 于 写 入 的 时 候 不 能 这 么 做 ， 但 这 里 我 们 不 需要 考虑 太 多 : 


return max(len(x.strip()) for x in open('/etc/motd')) 


A17 T 3$ X — BO o ix Fpe ix AUR — 11 9] Python r4, 7 GEAR EIE o RRRA 
在 Python 2.4 中 被 加 入 ， 你 可 以 在 PEP 289 中 找到 更 多 相关 内 容 。 


8.14 相关 模 : 


Python 2.2 引 进 了 先 代 器 ， 在 下 一 个 发 行 版 (2.3) 中 ，itertools 模 块 被 加 入 ， 用 来 帮助 那些 发 
现 和 迭代 器 威力 但 又 需要 一 些 辅助 工具 的 开发 者 。 a a tq ia 
的 文档 ， 你 会 发 现 生成 器 。 所 以 在 迭代 器 和 生成 器 间 有 一 定 的 联系 。 你 可 以 在 第 11 章 中 了 解 
更 多 。 


8.15 练习 

8-1. 条 件 语 句 。 请 看 下 边 的 代码 : 

# statement A 

AT x o» Ui 
# statement B 
pass 

eélif x < U: 
# statement C 
pass 

else: 
# statement D 
pass 


# statement E 
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(a) 如 果 x<0， 上 面 哪个 语句 【A, B, C, D, E) 将 被 执行 ? 
(b) 如 果 x==0， 上 面 哪个 居于 将 被 执行 ? 
(c) 如 果 x>0， 上 面 哪个 语句 将 被 执行 ? 


8-2. 循 环 。 编 写 一 个 程序 ， 让 用 户 输 入 3 个 数字 : (f) rom? (t) ofe (i) ncrement。 以 i 
为 步 长 ， 从 f 计 数 到 {t， 包 括 f 和 和 t。 人 例如， 如果 输 入 的 是 f==2、t ==26、i ==4， 程 序 将 输出 
2, 6, 10, 14, 18, 22, 26。 


8-3.range()。 如 果 我 们 需要 生成 下 面 的 这 些 列 表 ， 分 别 需 要 在 range() 内 建 函 数 中 提供 哪 
些 参数 ? 


(a) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
(b) [3, 6, 9, 12, 15, 18] 
(c) [-20, 200, 420, 640, 860] 


8-4. 素 数 。 我 们 在 本 章 已 经 给 出 了 一 些 代码 来 确定 一 个 数字 的 最 大 约 数 或 者 它 是 否 是 一 个 
素数 。 请 把 相关 代码 转换 为 一 个 返回 值 为 布尔 值 的 函数 ， 函 数 名 为 jsprime()。 如 果 输 入 
的 是 一 个 素数 ， 那 么 返回 True， 否 则 返回 False 。 


8-5. 约 数 。 完 成 一 个 名 为 getfactors() 的 函数 。 它 接受 一 个 整 型 作为 参数 ， 返 回 它 所 有 约 数 
的 列表 ， 包 括 1 和 它 本 身 。 


8-6. 素 因子 分 解 。 以 刚才 练习 中 的 isprime() 和 getfactors() 函 数 为 基础 编写 一 个 函数 ， 它 接 
受 一 个 整 型 作为 参数 ， 返 回 该 整 型 所 有 素数 因子 的 列表 。 这 个 过 程 叫做 求 素 因 子 分 解 ， 
它 输出 的 所 有 因子 之 积 应 该 是 原来 的 数字 。 注 意 列 表 里 可 能 有 重复 的 元 素 。 例 如 输入 

20 返回 结果 应 该 是 [2, 2, 5] 。 

8-7. 完 全 数 。 完 全 数 被 定义 为 这 样 的 数字 : 它 的 约 数 (不 包括 它 自己 ) 之 和 为 它 本 身 。 例 
如 : 6 的 约 数 是 1，2，3， 因 为 1+2+3=6， 所 以 6 被 认为 是 一 个 完全 数 。 编 写 一 个 名 为 
isperfect() 的 函数 ， 它 接受 一 个 整 型 作为 参数 ， 如 果 这 个 数字 是 完全 数 ， 返 回 1 ; 否则 返 
回 0 。 


8-8. 阶 乘 。 一 个 数 的 阶乘 被 定义 为 从 1 到 该 数字 所 有 数字 的 乘积 。N 的 阶乘 简写 为 NI。 
N ! == factorial (N) ==1*2*3*...* (N-2) * (N |) *N. So 4! == 1*2*3*4 


写 一 个 函数 ， 指 定 N， 返 回 N! 的 值 。 


8-9. 斐 波 那 契 数列 。 裴 波 那 契 数列 形 如 1，1，2，3，5，8，13, 21， 等 等 。 也 就 是 说 ， 
下 一 个 值 是 序列 中 前 两 个 值 之 和 。 写 一 个 函数 ， 给 定 N， 返 回 第 N 个 辈 波 那 契 数 字 。 例 
如 ， 第 1 个 辈 波 那 契 数字 是 1， 第 6 个 是 8。 

8-10. 文 本 处 理 。 统 计 一 句 话 中 的 元 音 ， 辅 音 及 单词 (以 空格 分 割 ) 的 个 数 。 忽 略 元 音 和 
辅音 的 特殊 情况 ， 如 “h”，“y”，“qu” 等 。 附 加 题 : 编写 处 理 这 些 特殊 情况 的 代码 。 
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8-11. 文 本 处 理 。 要 求 输入 一 个 姓名 列表 ， 输 入 格式 是 “LastName, First Name" 即 姓 去 号 
名 。 编 写 程序 处 理 输 入 ， 如 果 用 户 输入 错误 ， 比 如 “First Name Last Name ，”,， 请 纠正 这 
些 错误 ， 并 通知 用 户 。 同 时 你 还 需要 记录 输入 错误 次 数 。 当 用 户 输入 结束 后 ， 给 列表 排 
序 ， 然 后 以 * 姓 ， 名 ?的 顺序 显示 。 


输入 输出 示例 (你 不 需要 完全 按照 这 里 的 例子 完成 ) 


$ nametrack.py 
Enter total number of names: 5 


Please enter name 0: Smith, Joe 

Please enter name 1: Mary Wong 

»» Wrong format... should be Last, First. 

>> You have done this 1 time(s) already. Fixing input... 
Please enter name 2: Hamilton, Gerald 

Please enter name 3: Royce, Linda 

Please enter name 4: Winston Salem 

»» Wrong format... should be Last, First. 

>> You have done this 2 time(s) already. Fixing input... 


The sorted list (by last name) is: 

Hamilton, Gerald 

Royce, Linda 

Salem, Winston 

Smith, Joe 

Wong, Mary 
8-12. (3&7) 位 操作 。 编 写 一 个 程序 ， 用 户 给 出 起 始 和 结束 数字 后 给 出 一 个 下 面 这 样 的 
表格 ， 分 别 显 示 出 两 个 数字 间 所 有 整 型 的 十 进 制 ， 二 进 制 ， 八 进 制 和 十 六 进 制 表示 。 如 
果 字 符 是 可 打印 的 ASCII 字 符 ， 也 要 把 它 打 印 出 来 ， 如 果 没 有 一 个 是 可 打印 字符 ， 就 省 
略 掉 ASCII 那 一 栏 的 表 头 。 请 参考 下 面 的 输入 输出 格式 : 
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输出 示例 1 

输入 起 始 值 ，9 

输入 结束 值 : 18 
DEC BIN OCT HEX 
9 01001 11 9 
10 01010 12 a 
11 01011 13 b 
12 01100 14 c 
13 01101 15 d 
14 01110 16 e 
15 01111 17 f 
16 10000 20 10 
17 10001 21 11 
18 10010 22 12 

输出 示例 2 

输入 起 始 值 : 26 

输入 结束 值 : 41 


十 进 制 。 ”二进制 ”八进制 十 六 进 制 RSCII 


26 011010 32 la 
27 011011 33 lb 
28 011100 34 lc 
29 011101 "35 ld 
30 011110 36 le 
31 011111 37 1f 
32 100000 40 20 
33 100001 41 21 ! 
34 100010 42 22 5 
35 100011 43 23 4 
36 100100 44 24 $ 
37 100101 45 25 $ 
38 100110 46 26 & 
39 100111 47 27 1 
40 101000 50 28 ( 
41 101001 51 29 ) 


8-13. 程 序 执行 性 能 。 在 8.5.2 节 里 ， 我 们 介绍 了 两 种 基本 的 迭代 序列 方法 : (1) 通过 序 
列 项 ， 以 及 (2) 通过 序列 索引 遍历 。 该 小 节 的 末尾 我 们 指出 后 一 种 方法 在 序列 很 长 的 时 
候 性 能 不 佳 〈 在 我 的 系统 下 ， 性 能 差 了 将 近 两 倍 [83%]) 你 认为 它 的 原因 是 什么 ? 


第 8 章 ”条件 和 循环 327 


第 9 章 ”文件 和 输入 输出 


本 章 主题 

e 文件 对 象 

4 文件 内 建 函 数 
4 文件 内 建 方法 
4 文件 内 建 属性 
4 标准 文件 

e 命令 行 参 数 
e 文件 系统 

e 文件 执行 

e 持久 存储 

4 相关 模块 


本 章 将 深入 介绍 Python 的 文件 处 理 和 相关 输入 输出 能 力 。 我 们 将 介绍 文件 对 象 ( 它 的 内 建 函 
数 、 内 建 方法 和 属性 ) 、 标 准 文件 ， 同 时 讨论 文件 系统 的 访问 方法 、 文 件 执行 ， 最 后 简洁 地 
介绍 持久 存储 和 标准 库 中 与 文件 有 关 的 模块 。 


9.1 文件 对 象 


文件 对 象 不 仅 可 以 用 来 访问 普通 的 磁盘 文件 ， 也 可 以 访问 任何 其 他 类 型 抽象 层面 上 的 “文件 ”。 
一 旦 设置 了 合适 的 “ 钓 子 "， 你 就 可 以 访问 具有 文件 类 型 接口 的 其 他 对 象 ， 就 好 像 访 问 的 是 普通 
文件 一 样 。 


随 着 使 用 Python 经 验 的 增长 ， 会 遇 到 很 多 处 理 " 类 文件 "对 象 的 情况 。 有 很 多 这 样 的 例子 ， 例 如 


实时 地 “打开 一 个 URL? 来 读 取 Web 页 面 ， 在 另 一 个 独立 的 进程 中 执行 一 个 命令 进行 通信 ， 就 好 
像 是 两 个 同时 打开 的 文件 ， 一 个 用 于 读 取 ， 另 一 个 用 于 写 入 。 


内 建 函 数 open() 返 回 一 个 文件 对 象 ( 参 见 下 一 小 节 ) ， 对 该 文件 进行 后 续 相 关 的 操作 都 要 用 到 
它 。 还 有 大 量 的 函数 也 会 返回 文件 对 象 或 是 类 文件 (file-like) 对 象 。 进 行 这 种 抽象 处 理 的 主 
要 原因 是 许多 的 输入 /输出 数据 结构 更 趋向 于 使 用 通用 的 接口 。 这 样 就 可 以 在 程序 行为 和 实现 
上 保持 一 致 性 。 甚 至 像 Unix 这 样 的 操作 系统 把 文件 作为 通信 的 底层 架构 接口 。 请 记 住 ， 文 件 
只 是 连续 的 字 节 序列 。 数 据 的 传输 经 常会 用 到 字 节 流 ， 无 论 字 节 流 是 由 单个 字 节 还 是 大 块 数 
据 组 成 。 


9.2 文件 内 建 函 数 (open() 和 file() ) 


作为 打开 文件 之 门 的 “钥匙 "， 内 建 函 数 open()[ 以 及 file()] 提 供 了 初始 化 输入 /输出 (I/O ) 操作 的 
通用 接口 。open() 内 建 函 数 成 功 打开 文件 后 时 候 会 返回 一 个 文件 对 象 ， 否 则 引发 一 个 错误 。 妆 
操作 失败 ， Python 会 产生 一 个 IOError 异 常 一 我 们 会 在 下 一 章 讨 论 错 误 和 异常 的 处 理 。 内 建 
函数 open() 的 基本 语法 是 : 


file object open(file name, access mode-'r', buffering--1) 


file_name 有 是 包含 要 打开 的 文件 名 字 的 字符 串 ， 它 可 以 是 相对 路 径 或 者 绝对 路 径 。 可 选 变量 
access_mode 也 是 一 个 字符 囊 ， 代 表 文 件 打 开 的 模式 。 通 常 ， 文 件 使 用 模式 rT"，'W”， 或 
是 ‘a' 模 式 来 打开 ， 分 别 代 表 读 取 ， 写 入 和 追加 。 还 有 个 'U' 模 式 ， 代 表 通 用 换行 符 支持 ( 见 
n» 


使 用 或 'U' 模 式 打 开 的 文件 必须 是 已 经 存在 的 。 使 用 "WW" 模式 打开 的 文件 若 存 在 则 首先 清空 ， 
然后 (重新) 创建 。 以 ‘a 模式 打开 的 文件 是 为 追加 数据 作 准 备 的 ， 所 有 和 写 入 的 数据 都 将 追加 
到 文件 的 末尾 。 即 使 你 seek 到 了 其 他 的 地 方 。 如 果 文 件 不 存在 ， 将 被 自动 创建 ， 类 似 以 “W" 模 
式 打开 文件 。 如 果 你 是 一 个 C 程 序 员 ， 就 会 发 现 这 些 也 是 C 库 函数 fopen() 中 使 用 的 模式 。 


其 他 fopen() 支 持 的 模式 也 可 以 工作 在 Python 的 open() 下 。 包 括 '+' 代 表 可 读 可 写 ，'b' 代 表 二 进 
制 模式 访问 。 关 于 'b' 有 一 点 需要 说 明 ， 对 于 所 有 POSIX 兼 容 的 Unix 系 统 〈 包 括 Linux) 来 

说 ，b' 是 可 有 可 无 的 ， 因 为 它们 把 所 有 的 文件 当 作 二 进 制 文件 ， 包 括 文 本 文件 。 下 面 是 从 
Linux 手 册 的 fopen() 有 函数 使 用 中 摘录 的 一 段 ，Python 语 言 中 的 open() 函 数 就 是 从 它 衍生 出 的 。 


指示 文件 打开 模式 的 字符 串 中 也 可 以 包含 字符 “b”， 但 它 不 能 作为 第 一 个 字符 出 现 。 这 样 做 的 
目的 是 为 了 严格 地 满足 ANSI C3.159-1989 (FPANSI C). 中 的 规定 ; 事实 上 它 没 有 任何 效果 ， 
所 有 POSIX 兼 容 系统 ， 包 括 Linux， 都 会 忽略 "b”( 其 他 系统 可 能 会 区 分 文本 文件 和 二 进 制 文 
件 ， 如 果 你 要 处 理 一 个 二 进 制 文件 ， 并 希望 你 的 程序 可 以 移植 到 其 他 非 Unix 的 环境 中 ， 加 

上 “b” 会 是 不 错 的 主意 ) e 


你 可 以 在 表 9.1 中 找到 关于 文件 访问 模式 的 详细 列表 ， 和 包括 'b 的 使 用 一 一 如 果 你 选择 使 用 它 的 
话 。 如 果 没 有 给 定 access_mode， 它 将 自动 采用 默认 值 'r'。 


另外 一 个 可 选 参数 buffering 用 于 指示 访问 文件 所 采用 的 缓冲 方式 。 其 中 0 表示 不 缓冲 ，1 表 示 
只 缓冲 一 行 数据 ， 任 何其 他 大 于 1 的 值 代 表 使 用 给 定 值 作 为 缓冲 区 大 小 。 不 提供 该 参数 或 者 给 
定 负 值 代表 使 用 系统 默认 缓冲 机 制 ， 既 对 任何 类 电报 机 (tty). 设备 使 用 行 缓冲 ， 其 他 设备 使 
用 正常 缓冲 。 一 般 情况 下 使 用 系统 默认 方式 即 可 。 


m 9.1 文件 对 象 的 访问 模式 
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à. Python 2.5 中 新 增 。 


这 里 是 一 些 打 开 文 件 的 例子 : 


open('/etc/motd') 


Hh 
'O 
| 


open('test', 'w') 


Hh 
ge 
] 


open('data', 'r*') 


hh 
© 
ll 


fp = open(r'c: Mo.sys', 'rb') 


9.24 工厂 函数 file() 

在 Python 2.2 中 ， 类 型 和 类 被 统一 了 起 来 ， 这 时 加 入 了 内 建 函 数 file()。 当 时 ， 很 多 内 建 类 型 没 
有 对 应 的 内 建 函 数 来 创建 对 象 的 实例 ， 例 如 dict()、bool()、file() 等 。 然 而 ， 另 一 些 却 有 对 应 的 
内 建 函 数 ， 例 如 |ist()、str() 等 。 

open() 和 file() 函 数 具 有 相同 的 功能 ， 可 以 任意 替换 。 您 所 看 到 任何 使 用 open() 的 地 方 ， 都 可 以 
使 用 file() 替 换 它 。 


可 以 预见 ， 在 将 来 的 Python 版 本 中 ，open() 和 file() 有 函数 会 同时 存在 ， 完 成 相同 的 功能 。 一 般 
说 来 ， 我 们 建议 使 用 open() 来 读 写 文件 ， 在 您 想 说 明 您 在 处 理 文件 对 象 时 使 用 fle()， 例 如 if 


instance (f, file) 。 


9.2.2 ”通用 换行 符 支 持 (UNS) 


在 下 一 个 核心 笔记 中 ， 我 们 将 介绍 如 何 使 用 OS 模块 的 一 些 属性 来 帮助 你 在 不 同 平台 下 访问 文 
件 ， 不 同 平台 用 来 表示 行 结 束 的 符号 是 不 同 的 ， 例 如 \n，\r， 或 者 \rIn。 所 以 ，Python 的 解释 
器 也 要 处 理 这 样 的 任务 ， 特 别 是 在 导入 模块 时 分 外 重要 。 你 难道 不 希望 Python 用 相同 的 方式 
处 理 所 有 文件 吗 ? 


这 就 是 UNS (Universal NEWLINE Support， 通 用 换行 符 支持 ) 的 关键 所 在 ， 作 为 PEP 278 的 
结果 ，Python 2.3 引 入 了 UNS。 妆 你 使 用 必 ' 标 志 打 开 文 件 的 时 候 ， 所 有 的 行 分 隔 符 〈 或 行 结 
束 符 ， 无 论 它 原来 是 什么 ) 通过 Python 的 输入 方法 (例如 read*()) 返回 时 都 会 被 替换 为 换行 
符 NEWLINE (\n) 。 (TU' 模 式 也 支持 rb' 选 项 ) 。 这 个 特性 还 支持 包含 不 同类 型 行 结束 符 的 
文件 。 文 件 对 象 的 newlines 属 性 会 记录 它 曾 “看 到 的 "文件 的 行 结束 符 。 


如 果 文 件 刚 被 打开 ， 程 序 还 没有 遇 到 行 结 束 符 ， 那 么 文件 的 newlines 为 None。 在 第 一 行 被 读 
取 后 ， 它 被 设置 为 第 一 行 的 结束 符 。 如 果 遇 到 其 他 类 型 的 行 结 束 符 ， 文 件 的 newlines 会 成 为 一 
个 包含 每 种 格式 的 元 组 。 注 意 UNS 只 用 于 读 取 文 本 文件 。 没 有 对 应 的 处 理 文 件 输出 的 方法 。 


在 编译 Python 的 时 候 ，UNS 默 认 是 打开 的 。 如 果 你 不 需要 这 个 特性 ， 在 运行 configure 脚 本 
时 ， 你 可 以 使 用 --without-universal-newlines 开 关 关 闭 它 。 如 果 你 非 要 自己 处 理 行 结 束 符 ， 请 
查阅 核心 笔记 ， 使 用 os 模块 的 相关 属性 。 


9.3 文件 内 建 方法 


open() 成 功 执行 并 返回 一 个 文件 对 象 之 后 ， 所 有 对 该 文件 的 后 续 操 作 都 将 通过 这 个 “句柄 " 进 
行 。 文 件 方法 可 以 分 为 四 类 : 输入 、 输 出、 文件 内 移动 及 杂项 操作 。 所 有 文件 对 象 的 总 结 被 
列 在 了 表 9.3 中 。 我 们 现在 来 讨论 每 个 类 的 方法 。 


9.3.1 输入 


read() 方 法 用 来 直接 读 取 字 节 到 字符 串 中 ， 最 多 读 取 给 定数 目 个 字 节 。 如 果 没 有 给 定 size 参 数 
(默认 值 为 -1) 或 者 size 值 为 负 ， 文 件 将 被 读 取 直 至 末尾 。 未 来 的 茶 个 版 本 可 能 会 删除 此 方 
法 。 


readline() 方 法 读 取 打 开 文 件 的 一 行 ( 读 取 下 个 行 结束 符 之 前 的 所 有 字 节 ) 。 然 后 整 行 ， 包 括 
行 结束 符 ， 作 为 字符 串 返 回 。 和 read() 相 同 ， 它 也 有 一 个 可 选 的 Size 参数 ， 默 认为 -1， 代 表 读 
至 行 结束 符 。 如 果 提 供 了 该 参数 ， 那 么 在 超过 size 个 字 节 后 会 返回 不 完整 的 行 。 


readlines() 方 法 并 不 像 其 他 两 个 输入 方法 一 样 返 回 一 个 字符 串 。 它 会 读 取 所 有 《剩余 的 ) 行 然 
后 把 它们 作为 一 个 字符 串 列 表 返 回 。 它 的 可 选 参 数 sizhint 代 表 返 回 的 最 大 字 节 大 小 。 如 果 它 大 
于 0， 那 么 返回 的 所 有 行 应 该 大 约 有 sizhint 字 节 (可 能 稍微 大 于 这 个 数字 ， 因 为 需要 凑 齐 缓冲 
区 大 小 ) 。 


Python 2.1 中 加 入 了 一 个 新 的 对 象 类 型 用 来 高 效 地 和 迭代 文件 的 行 : xreadlines 对 象 (可 以 在 
xreadlines 模 块 中 找到 ) 。 调 用 file.xreadlines() 等 价 于 xreadlines.xreadlines (file) 。 
xreadlines() 不 是 一 次 性 读 取 所 有 的 行 ， 而 是 每 次 读 取 一 块 ， 所 以 用 在 for 循 环 时 可 以 减少 对 内 


存 的 占用 。 不 过 ， 随 着 Python 2.3 中 迭代 器 和 文件 迭代 的 引入 ， 没 有 必要 再 使 用 xreadlines() 
方法 ， 因 为 它 和 使 用 iter (file) 的 效果 是 一 样 的 ， 或 者 在 for 循 环 中 ， 使 用 for eachLine in file 代 
替 它 。 它 来 得 容易 ， 去 得 也 快 。 

另 一 个 废弃 的 方法 是 readinto()， 它 读 取 给 定数 目的 字 节 到 一 个 可 写 的 缓冲 器 对 象 ， 和 废弃 的 
buffer() 内 建 泡 数 返 回 的 对 象 是 同 个 类 型 〈 由 于 buffer() 已 经 不 再 支持 ， 所 以 readinto() 被 废 


#) 。 


9.3.2 输出 


write() 内 建 方法 的 功能 与 read() 和 readline() 相 反 。 它 把 含有 文本 数据 或 二 进 制 数据 块 的 字符 串 
写 入 到 文件 中 去 。 

和 readlines() 一 样 ，writelines() 方 法 是 针对 列表 的 操作 ， 它 接受 一 个 字符 串 列 表 作 为 参数 ， 将 
它们 写 入 文件 。 行 结束 符 并 不 会 被 自动 加入， 所 以 如 果 需 要 的 话 ， 你 必须 在 调用 writelines() 前 
给 每 行 结尾 加 上 行 结束 符 。 

注意 这 里 并 没有 “writeline()" 方 法 ， 因 为 它 等 价 于 使 用 以 行 结束 符 结 尾 的 单行 字符 串 调 用 write() 
方法 。 


核心 笔记 : 保留 行 分 隔 符 


当 使 用 输入 方法 如 read() 或 者 readlines() 从 文件 中 读 取 行 时 ，Python 并 不 会 删除 行 结束 符 ， 这 
个 操作 被 留 给 了 程序 员 。 例 如 这 样 的 代码 在 Python 程序 中 很 常见 : 


f = open('myFile', 'r') 
data = [line.strip() for line in f.readlines()] 
f.close() 


类 似 地 ， 输 出 方法 write() 或 writelines() 也 不 会 自动 加 入 行 结束 符 。 你 应 该 在 向 文件 写 入 数据 前 
自己 完成 。 


9.3.8 文件 内 移动 


seek() 方 法 (类似 C 中 的 fseek() 函 数 ) 可 以 在 文件 中 移动 文件 指针 到 不 同 的 位 置 。offset 字 节 
代表 相对 于 茶 个 位 置 偏 移 量 。 位 置 的 默认 值 为 0， 代 表 从 文件 开头 算 起 ( 即 绝 对 偏 移 量 ) ，1 
代表 从 当前 位 置 算 起 ，2 代 表 从 文件 末尾 工 起 。 如 果 你 是 一 个 C 程 序 员 ， 并 且 使 用 过 了 
fseek() > 那么 ，0、1、2 分 别 对 应 着 常量 SEEK_SET、SEEK_CUR 和 SEEK_END。 当 人 们 打 
开 文 件 进行 读 写 操作 的 时 候 就 会 接触 到 seek() 方 法 。 


text() 方 法 是 对 seek() 的 补充 ; 它 告诉 你 当前 文件 指针 在 文件 中 的 位 置 一 一 从 文件 起 始 算 起 ， 
单位 为 字 节 。 


9.3.4 文件 迭代 


一 行 一 行 访问 文件 很 简单 : 


for eachLine in f: 


在 这 个 循环 里 ，eachLine 代 表 文 本 文件 的 一 行 ( 包括 末尾 的 行 结束 符 ) ， 你 可 以 使 用 它 做 任 
何 想 做 的 事情 。 


在 Python 2.2 之 前 ， 从 文件 中 读 取 行 的 最 好 办 法 是 使 用 file.readlines() 来 读 取 所 有 数据 ， 这 样 
程序 员 可 以 尽快 释放 文件 资源 。 如 果 不 需要 这 样 做 ， 那 么 程序 员 可 以 调用 flle.readline() 一 次 读 
取 一 行 。 曾 有 一 段 很 短 的 时 间 ，file.xreadlines() 是 读 取 文件 最 高 效 的 方法 。 


在 Python 2.2 中 ， 我 们 引进 了 和 迭代 器 和 文件 和 迭代， 这 使 得 一 切 变 得 完全 不 同 ， 文 件 对 象 成 为 了 
iud 自己 的 迭代 器 ， 这 意味 着 用 户 不 必 调 用 read*() 方 法 就 可 以 在 for 循 环 中 和 迭代 文件 的 每 一 

。 另 外 我 们 也 可 以 使 用 迭代 器 的 next 方 法 ，file.next() 可 以 用 来 读 取 文 件 的 下 一 行 。 和 其 他 
器 一 样 ，Python 也 会 在 所 有 行 和 迭代 完成 后 引发 Stoplteration 异 常 。 


所 以 请 记 住 ， 如 果 你 见 到 这 样 的 代码 ， 这 是 “完成 事情 的 老 方法 "， 你 可 以 安全 地 删除 对 
readline() 的 调用 。 


for eachLine in f.readline(): 


文件 迭代 更 为 高 效 ， 而 且 写 (和 读 ) 这 样 的 Python 代码 更 容易 。 如 果 你 是 Python 新 手 ， 那 么 
请 使 用 这 些 新 特性 ， 不 必 担心 它们 过 去 是 如 何 。 


9.3.5 其 他 


close() 通 过 关闭 文件 来 结束 对 它 的 访问 。Python 垃 圾 收集 机 制 也 会 在 文件 对 象 的 引用 计数 降 
至 零 的 时 候 自动 关闭 文件 。 这 在 文件 只 有 一 个 引用 时 发 生 ， 例 如 fp=open C...) ， 然 后 fp 在 原 
文件 显 式 地 关闭 前 被 赋 了 另 一 个 文件 对 象 。 良 好 的 编程 习惯 要 求 在 重新 赋 另 一 个 文件 对 象 前 
关闭 这 个 文件 。 如 果 你 不 显 式 地 关闭 文件 ， 那 么 你 可 能 丢失 输出 缓冲 区 的 数据 。 


fileno() 方 法 返回 打开 文件 的 描述 符 。 这 是 一 个 整 型 ， 可 以 用 在 如 oS 模块 (os.read()) 的 一 些 
底层 操作 上 。 
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调用 flush() 方 法 会 直接 把 内 部 缓冲 区 中 的 数据 立刻 写 入 文件 ， 而 不 是 被 动 地 等 待 输出 缓冲 区 被 
写 入 。isatty() 是 一 个 布尔 内 建 函 数 ， 当 文件 是 一 个 类 tty 设 备 时 返回 True, 否 则 返回 False 。 
truncate() 方 法 将 文件 截取 到 当前 文件 指针 位 置 或 者 到 给 定 Size, 以 字 节 为 单位 。 


9.3.6 文件 方法 杂项 


我 们 现在 重新 实现 第 2 章 中 的 第 一 个 文件 例子 : 
filename = raw input('Enter file name: ') 
f = open(filename, 'r') 
allLines = f.readlines() 
f.close() 


for eachLine in allLines: 
print eachLine，# 支 持 输出 换行 符 

我 们 曾经 介绍 过 这 个 程序 。 与 大 多 数 标准 的 文件 访问 方法 相 比 ， 它 的 不 同 在 于 它 读 完 所 有 的 
行 才 开 始 向 屏幕 输出 数据 。 很 明显 如 果 文 件 很 大 ， 这 个 方法 并 不 好 。 这 时 最 好 还 是 回 到 最 可 
靠 的 方法 : 使 用 文件 迭代 器 ， 每 次 只 读 取 和 显示 一 行 : 

filename = raw input('Enter file name: ') 

f = open(filename, 'r') 

for eachLine in f: 

print eachLine; 
f.close() 


核心 笔记 : 行 分 隔 符 和 其 他 文件 系统 的 差异 


操作 系统 间 的 差异 之 一 是 它们 所 支持 的 行 分 隔 符 不 同 。 在 POSIX (Unix 系 列 或 MacOS 
X) 系统 上 ， 行 分 隔 符 是 换行 符 NEWLINE (M). 字符 。 在 昌 的 MacOS 下 是 RETURN ( 
\r) ， 而 DOS 和 Wind32 系 统 下 结合 使 用 了 两 者 (Ann) 。 检 查 一 下 你 所 使 用 的 操作 系统 
用 什么 行 分 隔 符 。 


另 一 个 不 同 是 路 径 分 隔 符 (POSIX 使 用 “PP : DOS 和 Windows 使 用 心 :旧版 本 的 MacOS 使 
A”) ; 它 用 来 分 隔 文件 路 径 名 ; 标记 当前 目录 和 父 目 录 。 当 我 们 创建 要 跨 这 3 个 平台 
的 应 用 的 时 候 ; 这 些 差异 会 让 我 们 感觉 非常 麻烦 (而 且 支 持 的 平台 越 多 越 麻 烦 ) o x6 
的 是 Python 的 os 模块 设计 者 已 经 帮 我 们 想到 了 这 些 问 题 。oSs 模 块 有 5 个 很 有 用 的 属性 。 它 
们 被 列 在 了 表 9.2 中 。 
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表 9.2 有 助 于 跨 平 台 开发 的 os 模块 属性 
os 模块 属性 Mo it 
linescp 用 于 在 文件 中 分 隔行 的 字符 让 
sep 用 来 分 了 文件 路 径 名 的 字符 串 
pathsep FALAREN 
curdir 当前 工作 目录 的 字符 串 名 称 
pardir CHE AE HRS. KAREP LR 


不 管 你 使 用 的 是 什么 平台 ， 只 要 你 导入 了 os 模块 ， 这 些 变 量 自动 会 被 设置 为 正确 的 值 ， 
减少 了 你 的 麻烦 。 


还 要 提醒 大 家 的 是 : print 语 名 默认 在 输出 内 容 末 尾 后 加 一 个 换行 符 ， 而 在 语句 后 加 一 个 
各 号 就 可 以 避免 这 个 行为 。readline() 和 [readlines() 驾 数 不 对 行 里 的 空白 字符 做 任何 处 理 
(参见 本 章 练 习 ) ， 所 以 你 有 必要 加 上 运 号 。 如 果 你 省 略 吉 号 ， 那 么 显示 出 的 文本 每 行 
后 会 有 两 个 换行 符 ， 其 中 一 个 是 输入 是 附带 的 ， 另 一 个 是 print 语 名 自动 添加 的 。 


文件 对 象 还 有 一 个 truncate() 方 法 ， 它 接受 一 个 可 选 的 Size 作 为 参数 。 如 果 给 定 ， 那 么 文 
件 将 被 截取 到 最 多 size 字 节 处 。 如 果 没 有 传递 size 参数 ， 那 么 默认 将 截取 到 文件 的 当前 位 
置 。 例 如 : 你 刚 打 开 了 一 个 文件 ， 然 后 立即 调用 truncate() 方 法 ， 那 么 你 的 文件 ( 内容) 
实际 上 被 删除 ， 这 时 候 你 其 实 是 从 0 字 节 开始 截取 的 (tell() 将 会 返回 这 个 数值 ) 。 


在 学 习 下 一 小 节 之 前 ， 我 们 再 来 看 两 个 例子 ， 第 一 个 展示 了 如 何 输出 到 文件 ， 第 二 个 展 
示 了 文件 的 输出 和 输入 ， 以 及 用 于 文件 定位 的 seek() 和 tell() 方 法 的 使 用 。 


filename = raw input('Enter file name: ') 
fobj = open (filename, 'w') 
while True: 
aLine = raw_input ("Enter a line ('.' to quit): ") 
if aLine l= ","; 
fobj.write('$s$s' $ (aLine, os.linesep) 
else: 
break 
fobj.close() 


这 里 我 们 每 次 从 用 户 接收 一 行 输入 ， 然 后 将 文本 保存 到 文件 中 。 由 于 raw_input() 不 会 保 
留用 户 输入 的 换行 符 ， 调 用 write() 方 法 时 必须 加 上 换行 符 。 而 且 ， 在 键盘 上 很 难 输入 一 个 
EOF (end-of-file) 字符 ， 所 以 ， 程 序 使 用 句点 (.) 作为 文件 结束 的 标志 ， 当 用 户 输入 
句点 后 会 自动 结束 输入 并 关闭 文件 。 


第 二 个 例子 以 可 读 可 写 模 式 创建 一 个 新 的 文件 (可 能 是 清空 了 一 个 现 有 的 文件 ) .在 向 文 
件 写 入 数据 后 ， 我 们 使 用 seek() 方 法 在 文件 内 部 移动 ， 使 用 tell() 方 法 展示 我 们 的 移动 过 


程 。 
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>>> f = open('/tmp/x',. 'w*') 
>>> f.tell() 


>>> f.write('test line 1\n') 
»»» f.tell() 


>>> f.write('test line 2Mn') 
>>> f.tell() 


>>> f.seek(-12,. 1) 
»»» f.tell() 

12 

>>> f.readline() 
'test line 2\012' 
>>> f.seek(0, 0) 
»»» f.readline() 
'test line 1\012' 
>>> f.tell() 

12 

>>> f.readline() 
'test line 2\012' 
>>> f.tell() 


24 
>>> f.close() 


表 9.3 文 件 对 象 的 内 建 方法 列表 。 
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# 加 入 一 个 长 为 12 的 字符 出 [0-11] 


& 加 入 一 个 长 为 12 的 字符 串 [12-23] 


# 告诉 我 们 当前 的 位 置 


à 问 后 移 12 个 字 节 
# 到 了 第 二 行 的 开头 


8 回 到 最 开始 


# 又 回 到 了 第 二 行 


# 又 到 了 结尾 


# 关闭 文件 
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表 9.3 文件 对 象 方法 
文件 对 象 方法 n dw 
file.close() 关闭 文件 
file.fileno() 返回 文件 的 措 述 符 《file descriptor, FD, SEMI) 
file.flush() 出 白文 件 的 内 部 说 冲 区 
file.isatty() 判断 file 是 否 是 一 个 类 ny 设备 
file.next'() Xil x fiif F—tr 《类似 于 filereadHne0》， 或 在 没有 其 他 行 时 引发 Stoplteration E 
file.read(size 1) Apiata a 当 未 给 定 size 或 给 定 负 值 的 时 候 ， 污 取 利 余 的 所 有 学 节 ， 然 
file.readinto (buf, size) 从 文件 读 取 size 个 字 节 到 buf MPB COR EMO 
file.readlinc(size— 1) A XfPPBOHPI- T? (ITAR) .« EEK size 个 字符 


访 家 文件 的 所 有 行 并 作为 一 个 列表 返回 (包含 所 有 的 行 结束 答 ); MRE sizhint 
HAF 0, 那么 将 返回 总 和 大 的 为 sizhint 字 节 的 行 ( 大 小 由 缓冲 器 容量 的 下 一 个 芋 


和 maglooe ho 人 决定 ) 《比如 说 缓冲 器 的 大 小 只 能 为 AK 的 信 数 ， 如 果 sizhint 为 15K， 则 最 后 返回 
的 可 能 是 16K 一 一 详 者 注 ) 
file xreadlines'() 用 于 选 代 ， 可 以 替换 readlines() 的 一 个 更 高 效 的 方法 
在 文件 中 移动 文件 指针 ， 从 whence CO 代表 文件 其 始 ，1 代表 当前 位 置 ，2 代表 文件 
fleseekfoff，whencc=0) AUD diit of 字 节 
file.iell( 返回 当前 在 文件 中 的 位 轩 
file truncate(size- file tell() 截取 文件 到 最 大 sue T. BUYSEN 
file write(str) 向 文件 写 入 字符 出 
向 文件 写 入 字符 冲 序 列 seq ; seq 应该 是 一 个 下 回 字符 串 的 可 迁 代 对 象 ; 在 22 前 , È 
mt 只 是 字 符 于 的 列表 
a. Python 22 ‘PRN. 


b. Python 1.52 中 新 增 ， 不 再 支持 ， 
€. Python 2.1 中 新 增 ， 在 Python 23 "PESE, 


9.4 文件 内 建 属性 


文件 对 象 除 了 方法 之 外 ， 还 有 一 些 数据 属性 。 这 些 属 性 保存 了 文件 对 象 相关 的 附加 数 

据 ， 例 如 文件 名 (fileename) ， 文 件 的 打开 模式 (file.mode) ,文件 是 否 已 被 关闭 
(file.closed) ， 以 及 一 个 标志 变量 ， 它 可 以 决定 使 用 print 语 名 打印 下 一 行 前 是 否 要 加 入 

一 个 空白 字符 (filesoftspace) 。 表 9.4 列 出 了 这 些 属 性 并 做 了 简短 说 明 o 





A94 文件 对 象 的 属性 
文件 对 象 的 属性 m it 
file.closed 表示 文件 已 经 被 关闭 ， 否 则 为 False 
fie.cacoding" 文件 所 使 用 的 篇 码 一 一 当 Unicode 字符 汕 被 写 入 数据 时 ， 它 们 将 自动 使 用 fileencoding 转换 为 学 
TOf. 若 file.encoding 为 None 时 使 用 系统 默认 编码 
续 表 
文件 对 象 的 饥 性 mo £ 
file.mode Access 文件 打开 时 使 用 的 访问 模式 
filc.name 文件 名 
mnie 未 访 乳 到 行 分 隔 符 时 为 None, RA 一 种 行 分 网 符 时 为 一 个 字符 事 ， 当 文 件 有 多 种 类 型 的 行 结束 符 
时 ， 旭 为 一 个 包含 所 有 当前 所 过 到 的 行 结束 符 的 列表 
file.sof ALES UN HMM 要 加 上 一 个 空格 符 ，1 表示 不 加 。 这 个 属性 一 般 程序 只 用 不 着 ， 由 程序 
a. 23 版 本 中 新 增 。 
9.5 标准 文件 
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一 般 说 来 ， 只 要 你 的 程序 一 执行 ， 你 就 可 以 访问 3 个 标准 文件 。 它 们 分 别 是 标准 输入 (一 
般 是 键盘 ) 、 标 准 输出 (到 显示 器 的 缓冲 输出 ) 和 标准 错误 〈 到 屏幕 的 非 缓 冲 输出 ) 
(这 里 所 说 的 “缓冲 "和 " 非 缓冲 "是 指 open() 函 数 的 第 3 个 参数 ) 。 这 些 文件 沿用 的 是 C 语 言 
中 的 命名 ， 分 别 为 stdin, stdout 和 stderr。 我 们 说 “只 要 你 的 程序 一 执行 就 可 以 访问 这 3 个 
标准 文件 ， 意 思 是 这 些 文件 已 经 被 预先 打开 了 “， 只 要 知道 它们 的 文件 句柄 就 可 以 随时 访 
问 这 些 文件 。 

Python 中 可 以 通过 sys 模 块 来 访问 这 些 文件 的 句柄 。 导 入 Sys 模 块 以 后 ， 就 可 以 使 用 
Sys.stdin ` sys.stdoutfesys.stderr37 I*] » printi& 4] 38 3$ t 4 B Zl sys.stdout ; 而 内 建 
raw_input() 则 通常 从 sys.stdin 接 收 输入 。 

记得 Sys.* 是 文件 ， 所 以 你 必须 自己 处 理 好 换行 符 。 而 print 语 句 会 自动 在 要 输出 的 字符 串 
后 加 上 换行 符 。 


9.6 命令 行 参数 


Sys 模 块 通过 sys.argVv 属 性 提供 了 对 命令 行 参数 的 访问 。 命 令 行 参数 是 调用 茶 个 程序 时 除 
程序 名 以 外 的 其 他 参数 。 这 样 命名 是 有 历史 原因 的 ， 在 一 个 基于 文本 的 环境 里 (比如 
UNIX 操 作 系 统 的 shell 环 境 或 者 DOS-shell) ， 这 些 参数 和 程序 的 文件 名 一 同 被 输入 的 。 
但 在 IDE 或 者 GUI 环境 中 可 能 就 不 会 是 这 样 了 ， 大 多 1DE 环 境 都 提供 一 个 用 来 输入 "命令 行 
参数 "的 窗口 ; 这 些 参数 最 后 会 像 命令 行 上 执行 那样 被 传递 给 程序 。 


熟悉 C 语 言 的 读者 可 能 会 同 了 ，"argc 哪 去 了 ? "argc 和 argv 分 别 代 表 参 数 个 数 (argument 
count) 和 参数 向 量 (argument vector) 。argv 变 量 代表 一 个 从 命令 行 上 输入 的 各 个 参数 
组 成 的 字符 串 数 组 ;argc 变 量 代表 输入 的 参数 个 数 。 在 Python 中 ，argc 其 实 就 是 sys.argv 
列表 的 长 度 ， 而 该 列表 的 第 一 项 sys.argv[0] 永 远 是 程序 的 名 称 。 


总 结 如 下 : 

e Sys.argV 是 命令 行 参数 的 列表 ; 

e len (sys.argv) 是 命令 行 参数 的 个 数 (也 就 是 argc) 。 
我 们 来 创建 这 个 名 为 argv.py 的 测试 程序 : 

import sys 


print 'you entered', len(sys.argv), 'arguments...' 


print 'they were: ', str(sys.argv) 
下 面 是 该 脚本 程 运行 的 输出 : 


$ argv.py 76 tales 85 hawk 
you entered 5 arguments... 


they were: ['argv.py', '76', 'tales', '85', 'hawk'] 
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命令 行 参数 有 用 吗 ? Unix 操 作 系 统 中 的 命令 通常 会 接受 输入 ， 执 行 一 些 功 能 ， 然 后 把 结 

果 作 为 流 输出 出 来 。 这 些 输 出 的 结果 还 可 能 被 作为 下 一 个 程序 的 输入 数据 ， 在 完成 了 一 
些 其 他 处 理 后 ， 再 把 新 的 输出 送 到 下 一 个 程序 。 如 此 延伸 下 去 。 各 个 程序 的 输出 一 般 是 
不 保存 的 ， 这 样 可 以 节省 大 量 的 磁盘 空间 ， 各 个 程序 的 输出 通常 使 用 “管道 "实现 到 下 个 程 
序 输入 的 转换 o 


通过 向 命令 行 提 供 数 据 或 是 通过 标准 输入 实现 的 。 当 一 个 程序 显示 或 是 发 送 它 的 输 
出 到 标准 输出 文件 时 ， 内 容 就 会 出 现在 屏幕 上 一 一 除非 该 程序 被 管道 连接 到 下 一 个 程 
序 ， 那 么 此 时 程序 的 标准 输出 就 成 为 下 个 程序 的 标准 输入 。 你 现在 明白 了 吧 ? 


命 


S% 


令 行 参 数 使 程序 员 可 以 在 启动 一 个 程序 的 时 候 对 程序 行为 做 出 选择 。 在 大 多 情况 下 ， 
这 些 执 行 操 作 都 不 需要 人 为 干预 ， 通过 批 处 理 执 行 。 命 令 行 参 数 配 合 程序 选项 可 以 实现 
这 样 的 处 理 功能 。 让 计算 机 在 夜里 有 空 闪 时 完成 一 些 需要 大 量 处 理 的 工作 。 


Python 还 提供 了 两 个 模块 用 来 辅助 处 理 命令 行 参 数 。 其 中 一 个 (最 原始 的 ) X getopti 

块 ， 它 更 简单 些 ， 但 是 不 是 很 精细 。 而 Python 2.3 引 入 的 optparse 模 块 提供 了 一 个 更 强大 

jr 而 且 它 更 面向 对 象 。 如 果 你 只 是 用 到 一 些 简单 的 选项 ， 我 们 推荐 getopt， 但 如 果 
你 需要 提供 复杂 的 选项 ， 那 么 请 参阅 optparse。 


9.7 文件 系统 


对 文件 系统 的 访问 大 多 通过 Python 的 os 模块 实现 。 该 模块 是 Python 访问 操作 系统 功能 的 
主要 接口 。os 模 块 实际 上 只 是 引 正 加 载 的 模块 的 前 端 ， 而 真正 的 那个 “模块 "明显 要 依赖 与 
具体 的 操作 系统 。 这 个 “站 正 "的 模块 可 能 是 以 下 几 种 之 一 : posix 〈 适 用 于 Unix 操 作 系 
5L) ，nt (Win32) ,mac (旧版 本 的 MacOS) , dos (DOS) ,os2 (OS/2) ,等 等 。 你 
不 需要 直接 导入 这 些 模块 。 只 要 导入 Os 模块 ，Python 会 为 你 选择 正确 的 模块 ， 你 不 需要 
考虑 底层 的 工作 。 根 据 你 系统 支持 的 特性 ， 你 可 能 无 法 访问 到 一 些 在 其 他 系统 上 可 用 的 
属性 。 


除了 对 进程 和 进程 运行 环境 进行 管理 外 ，oSs 模 块 还 负责 处 理 大 部 分 的 文件 系统 操作 ， 应 
用 程序 开发 人 员 可 能 要 经 常用 到 这 些 。 这 些 功能 包括 删除 / 重 命名 文件 ， 遍 历 目 录 树 ， 以 
及 管理 文件 访问 权限 等 。 表 9.5 列 出 os 模块 提供 的 一 些 常见 文件 或 目录 操作 函数 。 


另 一 个 模块 os.path 可 以 完成 一 些 针 对 路 径 名 的 操作 。 它 提供 的 函数 可 以 完成 管理 和 操作 
文件 路 径 名 中 的 各 个 部 分 ， 获 取 文 件 或 子 目 录 人 信息， 文件 路 径 查 询 等 操作 。 表 9.6 列 出 了 
os.path 中 的 几 个 比较 常用 的 函数 。 


这 两 个 模块 提供 了 与 平台 和 操作 系统 无 关 的 统一 的 文件 系统 访问 方法 。 例 9. 
(ospathex.py) 展示 了 os 和 os.path 模 块 中 部 分 函数 的 使 用 。 


第 9 章 文件 和 输入 输出 339 


Python 核心 编程 第 二 版 


m 9.5 os 模块 的 文件 /目录 访问 函数 
i k A i£ 
文件 处 理 
mkfifo( y mknod()* titi Vt upon x noe vr 
removet yunlink() puexn 
renamc()/renames()" 重 命 名 文件 
*stat' () 返回 文件 信息 
"x 
EE A g 
symlink() 创建 符号 链接 
utime() ELLE 
impfile() 创建 并 打开 Cw) 一 个 新 的 临时 文件 
walk()* 生成 一 个 目录 树 下 的 所 有 文 牢 名 
目录 /文件 夹 
ehdir(fchdir() PUE WIL MEHR ETE PEHBUGUE TE OCEPICEE PE ELSE 
chroott) i&S ^o e Host 
listdir() »tlifig Hx xr 
getewd(y/getewdu()" HESTER. MEEA Unicode 对 象 
mkdir y/makedirs() DL AIETUL EAE 
máir(y/removedirs() Bu HUN EIÍ HX 
Wit Rt 
access) 检验 权限 模式 
chmod) 改变 权限 模式 
chown(ylchown(* 改变 owner 和 group ID/ 功 能 相同 ， 但 不 会 跟踪 链接 
umask() GNNXURRMX 
文件 的 述 符 操 作 







底层 的 换 作 系统 open 〔 对 于 文件 ， 他 用 标准 的 内 建 opea() 函数 ) 
根据 文件 描述 符 读 取 / 写 入 数 拱 
复制 文件 描述 符号 /功能 相 网， 但 是 是 复制 到 另 一 个 文件 措 述 符 





meu 
makedev()* 从 major 和 minor 4 GU — nee v 
major)” /minor()" 从 原始 设备 号 效 得 majorminor 设备 号 
a. Python 23 版 新 增 。 


b. Python 1.52 版 新 增 。 
. ELIA stats Istat)» xstat(). 


& on 


. Python 22 f Bf. 
96 os.path 模块 中 的 路 径 名 访问 函数 
A t LES. 
Ll 
basename() ZXESHAhf. Xf 
dimame() 去 掉 文 件 名 ， 返 里 目 录 路 从 
join0) 将 分 离 的 各 帮 分 组 合成 一 个 政 径 名 
split) 返回  (dimame(). basename() 元 组 
splitdrive() MAE  Cdrivename, pathaame) 元 组 
splitexit) WE) (filename, extension) 元 组 
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"x 
H X d 3 
信息 
getatime() 返回 最 近 访 向 时 间 
getetime() 返回 文件 创建 时 间 
getmtime() 3 [e A X C PE M RCM f 
getsize() 返回 文件 大 小 《以 学 节 为 单位 )》 
查询 
exists() om RATO MEE 
isabs() 指定 路 入 是 吾 为 的 对 路 各 
isdir() 猎 定 路 径 是 否 存在 县 为 一 个 目录 
isfile() 指定 路 径 是 局 存在 有 为 一 个 文件 
islink() 指定 路 径 是 否 存在 且 为 一 个 符号 链接 
ismount() TOEPHEICSEHEBNx MER 
samefile() 


两 个 路 径 名 是 否 指向 周一 个 文件 
例 9.1 os 和 os.path 模 块 例子 (ospathex.py) 
这 段 代码 练习 使 用 一 些 os 和 os.path 模 块 中 的 功能 。 它 创建 一 个 文本 文件 ， 写 入 少量 数 


据 ， 然 后 重 命名 ， 输 出 文件 内 容 。 同 时 还 进行 了 一 些 辅助 性 的 文件 操作 ， 比 如 遍历 目录 
树 和 文件 路 径 名 处 理 。 
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1 £&!/usr/bin/env python 


2 

3 import os 

4 for tmpdir in ('/tmp', r'c: Ntemp'): 

2 if os.path.isdir(tmpdir): 

6 break 

7 else: 

8 print 'no temp directory available' 
9 tmpdir = '' 

10 


11 if tmpdir: 

12 os.chdir(tmpdir) 

13 cwd = os.getcwd() 

14 print '*** current temporary directory' 


15 print cwd 


16 

17 print '*** creating example directory..." 
18 os.mkdir('example') 

19 os.chdir('example') 

20 cwd = os.getcwd() 

21 print '*** new working directory: ' 


22 print cwd 


23 print '*** original directory listing: ' 
24 print os.listdir(cwd) 
25 


第 9 章 文件 和 输入 输出 342 


Python 核心 编程 第 二 版 


26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 


print '*** creating test file..." 

fobj = open('test', 'w') 
fobj.write('fooMn') 

fobj.write('barMn') 

fobj.close() 

print '*** updated directory listing: ' 
print os.listdir(cwd) 


print "*** renaming 'test' to 'filetest.txt'" 
os.rename('test', 'filetest.txt') 

print '*** updated directory listing: ' 

print os.listdir(cwd) 


path = os.path.join(cwd,. os.listdir (cwd)[0]) 
print '*** full file pathname' 

print path 

print '*** (pathname, basename) ==' 

print os.path.split (path) 

print '*** (filename, extension) ==' 


print os.path.splitext(os.path.basename (path) ) 


print '*** displaying file contents: ' 
fobj = open(path) 
for eachLine in fobj: 
print eachLine, 
fobj.close() 


print '*** deleting test file' 
os.remove (path) 

print '*** updated directory listing: ' 
print os.listdir(cwd) 
os.chdir(os.pardir) 

print '*** deleting test directory' 
os.rmdir('example') 

print '*** DONE' 


os 的 子 模块 os.path 更 多 用 于 文件 路 径 名 处 理 。 比 较 常 用 的 属性 列 于 表 9.6 中 。 在 Unix 平 台 
下 执行 该 程序 ， 我 们 会 得 到 如 下 输出 : 
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$ ospathex.py 

*** current temporary directory 
/ tmp 

*** creating example directory... 
*** new working directory: 
/tmp/example 

*** original directory listing: 
[] 


*** creating test file... 
*** updated directory listing: 
['test'] 
*** renaming 'test' to 'filetest.txt' 
x updated directory listing: 
['filetest.txt'] 
*** full file pathname: 
/tmp/example/filetest.txt 
*** (pathname, basename) -- 
('/tmp/example', 'filetest.txt') 
*** (filename, extension) -- 
('filetest', TERE) 
*** displaying file contents: 
foo 
bar 
*** deleting test file 
*** updated directory listing: 
[] 
*** deleting test directory 
*** DONE 
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在 DOS 窗口 下 执行 这 个 例子 我 们 会 得 到 非常 相似 的 输出 : 
C: \>python ospathex.py 
*** current temporary directory 
c: NwindowsNtemp 
*** creating example directory... 
*** new working directory: 
c: NwindowsNtempNVexample 
*** original directory listing: 
[] 
*** creating test file... 
*** updated directory listing: 
['test'] 
*** renaming 'test' to 'filetest.txt' 
*** updated directory listing: 
['filetest.txt'] 
*** full file pathname: 
c: NwindowsNtempNexampleNMfiletest.txt 
*** (pathname, basename) == 
('c: NNwindowsNNXtempNNexample', 'filetest.txt') 
*** (filename, extension) == 
('filetest', '.txt') 
*** displaying file contents: 
foo 
bar 
*** deleting test file 
*** updated directory listing: 


[] 
*** deleting test directory 


*ž*+* DONE 


这 里 就 不 逐 行 解释 这 个 例子 了 ， 我 们 把 这 个 留 给 读者 做 练习 。 下 面 我 们 来 看 看 一 个 类 似 
的 交互 式 例子 〈 和 包括 错误 ) ， 我 们 会 把 代码 分 成 几 个 小 段 ， 然 后 依次 进行 讲解 。 
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>>> import os 
»»» os.path.isdir('/tmp') 


True 


>>> os.chdir('/tmp') 
>>> cwd = os.getcwd() 
>>> cwd 

'/tmp' 


代码 的 第 一 部 分 导入 了 os 模块 (同时 也 包含 os.path 模 块 ) 。 然 后 检查 并 确认 "Itmp' t — 
个 合法 的 目录 ， 并 切换 到 这 个 临时 目录 开始 我 们 的 工作 。 之 后 我 们 用 getcwd() 方 法 确认 
我 们 当前 位 置 。 


>>> os.mkdir('example') 

>>> os.chdir('example') 

>>> cwd = os.getcwd() 

>>> cwd 

' /tmp/example' 

>>> 

>>> os.listdir() # oops, forgot name 
Traceback (innermost last): 

File "«stdin»", line 1, in ? 
TypeError: function requires at least one argument 
>>> 
>>> os.listdir(cwd) # that's better : ) 
[] 


接 下 来 ， 我 们 在 临时 目录 里 创建 了 一 个 子 目 录 ， 然 后 用 listdir() 方 法 确认 目录 为 空 (因为 


我 们 刚 创建 它 ) 。 第 一 次 调用 listdir() 调 用 时 出 现 的 问题 是 因为 我 们 没有 传递 要 列 目 录 的 
路 径 名 。 我 们 马上 在 第 二 次 调用 时 修正 了 这 个 失误 。 
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>>> fobj = open('test', 'w') 
>>> fobj.write('fooMn') 
>>> fobj.write('barMn') 
>>> fobj.close() 
>>> os.listdir (cwd) 
['test'] 
这 里 我 们 创建 了 一 个 有 两 行内 容 的 test 文 件 ， 之 后 列 目录 确认 文件 被 成 功 创建 。 


>>> os.rename('test', 'filetest.txt') 

>>> os.listdir(cwd) 

['filetest.txt'] 

>>> 

>>> path = os.path.join(cwd, os.listdir(cwd) [0]) 
>>> Path 

'/tmp/example/filetest.txt' 

>>> 

>>> os.path.isfile(path) 

True 

>>> os.path.isdir (path) 

False 

>>> 

>>> os.path.split (path) 

('/tmp/example', 'filetest.txt') 

>>> 

>>> os.path.splitext (os.path.basename (path) ) 


('filetest', '.ext') 


这 一 段 代码 使 用 了 os.path 的 一 些 功 能 ， 包 括 我 们 之 前 看 到 过 的 join() >` isfile() » isdir() ` 
split()、basename() 和 splitext(), 我 们 还 调用 了 os 下 的 rename() 元 数 。 接 下 来 ， 我 们 显示 
文件 的 内 容 ， 之 后 ， 删 除 之 前 创建 的 文件 和 目录 。 
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>>> fobj = open(path) 
>>> for eachLine in fobj: 


eh print eachLine; 


>>> fobj.close() 
>>> os.remove (path) 
>>> os.listdir (cwad) 


>>> os.chdir(os.pardir) 


>>> os.rmdir('example') 





核心 模块 : os (和 os.path) 


从 上 面 这 些 长 篇 讨论 可 以 看 出 ，0os 和 os.path 模 块 提供 了 访问 计算 机 文件 系统 的 不 同方 
法 。 我 们 在 本 章 学 习 的 只 是 文件 访问 方面 ， 事 实 上 os 模块 可 以 完成 更 多 工作 。 我 们 可 以 
通过 它 管理 进程 环境 ， 甚 至 可 以 让 一 个 Python 程序 直接 与 另外 一 个 执行 中 的 程序 "对 话 ”。 
你 很 快 就 会 发 现 自己 离 不 开 这 个 模块 了 。 更 多 关于 OS 模块 的 内 容 请 参阅 第 14 章 。 

9.8 文件 执行 

无 论 你 只 是 想 简单 地 运行 一 个 操作 系统 命令 ， 调 用 一 个 二 进 制 可 执行 文件 ， 或 者 其 他 类 
型 的 脚本 (可 能 是 shell 脚 本 ，Perl, 或 是 Tcl/Tk) ,都 需要 涉及 运行 系统 其 他 位 置 的 其 他 文 
件 。 尽 管 不 经 常 出 现 ， 但 是 有 时 甚至 会 需要 局 动 另 外 一 个 Python 解释 器 。 我 们 将 把 这 部 
分 内 容留 到 第 14 章 去 讨论 。 如 果 读 者 有 兴趣 了 解 如 何 启 动 其 他 程序 ， 以 及 如 何 与 它们 进 
行 通讯 ， 或 者 是 Python 执行 环境 的 一 般 信 息 ， 都 可 以 在 第 14 章 找到 答案 。 
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9.9 永久 存储 模块 


在 本 书 的 很 多 练习 里 ， 都 需要 用 户 输 入 数据 。 这 可 能 需要 用 户 多 次 输入 重复 的 数据 ， 尤 
其 是 如 果 你 要 输入 大 批 数据 供 以 后 使 用 时 ， 你 肯定 会 厌烦 。 这 就 是 永久 储存 大 显 身 手 的 

地 方 了 ， 它 可 以 把 用 户 的 数据 归档 保存 起 来 供 以 后 使 用 ， 这 样 你 就 可 以 避免 每 次 输入 同 

样 的 信息 。 在 简单 的 磁盘 文件 已 经 不 能 满足 你 的 需要 ， 而 使 用 完整 的 关系 数据 库 管 理 系 

统 (relational database management systems,RDBMS ) 又 有 些 大 材 小 用 时 ， 简 单 的 永 
久 性 储存 就 可 以 发 挥 它 的 作用 。 大 部 分 永久 性 储存 模块 是 用 来 储存 字符 囊 数据 的 ， 但 是 

也 有 方法 来 归档 Python 对 象 。 


9.9.1 pickle 和 marshaU£ 2X 


Python 提 供 了 许多 可 以 实现 最 小 化 永久 性 储存 的 模块 。 其 中 的 一 组 (marshal 和 pickle) 
可 以 用 来 转换 并 储存 Python 对 象 。 该 过 程 将 比 基 本 类 型 复杂 的 对 象 转换 为 一 个 二 进 制 数 
据 集 合 ， 这 样 就 可 以 把 数据 集合 保存 起 来 或 通过 网 络 发 送 ， 然 后 再 重新 把 数据 集合 恢复 
原来 的 对 象 格式 。 这 个 过 程 也 被 称 为 数据 的 扁平 化 、 数 据 的 序列 化 或 者 数据 的 顺序 化 。 
另外 一 些 模 块 (dbhash/bsddb,dbm,gdbm,dumbdbm 等 ) 及 它们 的 “管理 器 *” (anydbm) 
只 提供 了 Python 字符 串 的 永久 性 储存 。 而 最 后 一 个 模块 (shelve) 则 两 种 功能 都 具备 。 


我 们 已 经 提 到 marshal 和 pickle 模 块 都 可 以 对 Python 对 象 进 行 储 存 转换 。 这 些 模块 本 身 并 
没有 提供 “永久 性 储存 "的 功能 ， 因 为 它们 没有 为 对 象 提 供 名 称 空 间 ， 也 没有 提供 对 永久 性 
储存 对 象 的 并 发 写 入 访问 〈concuirent write access) o 它 们 只 能 储存 转换 Python 对 象 ， 
为 保存 和 传输 提供 方便 。 数 据 储 存 是 有 次 序 的 (对象 的 储存 和 传输 是 一 个 接 一 个 进行 
的 ) 。marshal 和 pickle 模 块 的 区 别 在 于 marshal 只 能 处 理 简单 的 Python 对 象 (数字 、 序 
列 、 了 映射 以 及 代码 对 象 ) ， 而 pickle 还 可 以 处 理 递 归 对 象 ， 被 不 同 地 方 多 次 引用 的 对 象 ， 
以 及 用 户 定义 的 类 和 实例 。pickle 模 块 还 有 一 个 增强 的 版 本 叫 cPickle, 使 用 C 实 现 了 相关 的 


功能 。 


9.9.2 DBM 风 格 的 模块 


*db* 系 列 的 模块 使 用 传统 的 DBM 格 式 写 入 数据 ,Python 提供 了 DBM 的 多 种 实现 : 
dbhash/bsddb、dbm、gdbm 和 dumbdbm 等 。 你 可 以 随便 按照 你 的 爱好 使 用 ， 如 果 你 不 
确定 的 话 ， 那 么 最 好 使 用 anydbm 模 块 ， 它 会 自动 检测 系统 上 已 安装 的 DBM 兼 容 模块 ， 并 
选择 "最 好 "的 一 个 。 dumbdbm 模 块 是 功能 最 少 的 一 个 ， 在 没有 其 他 模块 可 用 时 ， 
anydbm 才 会 选择 。 这 些 模 块 为 用 户 的 对 象 提供 了 一 个 命名 空间 ， 这 些 对 象 同时 具备 字典 
对 象 和 文件 对 象 的 特点 。 不 过 不 足 之 处 在 于 它们 只 能 储存 字符 串 ， 不 能 对 Python 对 象 进 
行 序列 化 。 


9.9.3 shelve + 
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最 后 ， 我 们 来 看 一 个 更 为 完整 的 解决 方案 ，shelve 模 块 。shelve 模 块 使 用 anydbm 模 块 寻 
找 合适 的 DBM 模 块 ， 然 后 使 用 cPickle 来 完成 对 储存 转换 过 程 。Sshelve 模 块 允许 对 数据 库 
文件 进行 并 发 的 读 访问 ， 但 不 允许 共享 读 / 写 访问 。 这 也 许 是 我 们 在 Python 标 准 库 里 找到 
的 最 接近 于 永久 性 储存 的 东西 了 。 可 能 有 一 些 第 三 方 模块 实现 了 "“ 旧 正 ?的 永久 性 储存 。 图 
9-1 展 示 了 储存 转换 模块 与 永久 性 储存 模块 之 间 的 关系 ， 以 及 为 何 shelve 对 象 能 成 为 两 者 
的 最 好 的 选择 的 。 





marshal 


pickle 


提供 Python 对 象 序列 化 或 存储 。 ”提供 一 个 类 似 字典 和 文件 的 对 象 ， 
转换 功能 可 以 完成 字符 串 的 永久 性 储存 


提供 了 Python 对 象 的 序列 化 和 存储 转换 ， 以 及 类 似 字 典 
和 文件 的 对 象 ， 可 以 完成 Python 对 象 的 永久 性 储存 





图 9-1 用 于 序列 化 和 永久 性 储存 的 Python 模块 





核心 模块 : pickle 和 cPickle 


Python 核心 编程 第 二 版 


你 可 以 使 用 pickle 模 块 把 Python 对 象 直接 保存 到 文件 里 ， 而 不 需要 把 它们 转化 为 字符 串 ， 
也 不 用 底层 的 文件 访问 操作 把 它们 写 入 到 一 个 二 进 制 文 件 里 。pickle 模 块 会 创建 一 个 
Python 语言 专用 的 二 进 制 格式 ， 你 不 需要 考虑 任何 文件 细节 ， 它 会 帮 你 干净 利索 地 完成 
读 写 对 象 操 作 ， 唯 一 需要 的 只 是 一 个 合法 的 文件 句柄 。 


pickle 模 块 中 的 两 个 主要 函数 是 dump() 和 load()。dump() 有 函数 接受 一 个 文件 句柄 和 一 个 数 
据 对 象 作 为 参数 ， 把 数据 对 象 以 特定 格式 保存 到 给 定 文件 里 。 当 我 们 使 用 load() 函 数 从 文 
件 中 取出 已 保存 的 对 象 时 ，pickle 知 道 如 何 恢 复 这 些 对 象 到 它们 本 来 的 格式 。 我 们 建议 你 
看 一 看 pickle 和 更 “聪明 "的 shelve 模 块 ， 后 者 提供 了 字典 式 的 文件 对 象 访 问 功 能 ， 进 一 步 
减少 了 程序 员 的 工作 。 


cPickle 是 pickle 的 一 个 更 快 的 C 语 言 编 译 版 本 。 
9.10 ”相关 模块 


还 有 大 量 的 其 他 模块 与 文件 和 输入 /输出 有 关 ， 它 们 中 的 大 多 数 都 可 以 在 主流 平台 上 工 
作 。 表 9.7 列 出 了 一 些 文件 相关 的 模块 。 


&*97 文件 相关 模块 

no k 内 ou 
bascót 提供 二 过 制 字符 串 和 文本 字符 申 间 的 编码 /解码 换 作 

binascii BURIE MARI ASCI RPH ETT RADR F 
bz2* 访问 BZ2 格式 的 压缩 文件 
ev 访问 cv Xf GESAHRXD 

filecmp" 用 于 比较 目录 和 文件 

fileinput 提供 多 个 文本 文 忻 的 行 区 代 器 


Ectoptioptparsc' 提供 了 会 令 行 参 数 的 解析 /处 理 
glob/fnmatch 提供 Unix 样式 的 通配符 匹配 的 功能 


gripizlib i GNU zip (gip) XfF CIRSUETE zlib Wik) 
shutil 提供 高 级 文件 访问 功能 
S/StringlO 对 学 符 下 对 象 提供 类 文件 接口 
tarfile* iS TAR 归档 文件 ， 支 持 压 缩 文件 
tempfile tit — er xf OE) 
uu vu Mac o URF 
zipfile * 用 于 读 取 ZIP 归档 文件 的 工具 
a. Python 2.3 中 新 增 ， 
b. Python 2.0 中 新 增 。 
€. Python 1.6 *P Off. 


fileinput 模 块 遍历 一 组 输入 文件 ， 每 次 读 取 它们 内 容 的 一 行 ， 类 似 Perl 语 言 中 的 不 带 参 数 
的 “<>” 操 作 符 。 如 果 没 有 明确 给 定 文件 名 ， 则 默认 从 命令 行 读 取 文件 名 。 


glob 和 fnmatch 模 块 提供 了 老式 Unix shell 样 式 文 件 名 的 模式 匹配 ， 例 如 使 用 星 号 (*) 通 
配 符 代表 任意 字符 串 ， 用 问号 (7) 匹配 任意 单个 字符 。 
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核心 提示 : 使 用 os.path.expanduser() 的 波浪 号 (~) 进行 扩展 


虽然 glob 和 fnmatch 提 供 了 Unix 样 式 的 模式 匹配 ， 但 它们 没有 提供 对 2 户 目 录 ) 


字符 ， 一 的 支持 。 NADA path. Pn 数 来 完成 这 Us 能 ， 传 递 一 个 带 波 
浪 号 的 目录 ， 然 后 它 会 返回 对 应 的 绝对 路 径 。 这 里 是 两 个 例子 ， 分 另 WR 
Win32283 T : 


>>> os.path.expanduser('--/py') 


' /home/wesley/py' 


>>> os.path.expanduser('--/py') 


'C: NNDocuments and SettingsNNwesley/py' 


另外 Unix 衍 生 系统 还 支持 “~Uuser 这 样 的 用 法 ， 表 示 指 定 用 户 的 目录 ， 还 要 注意 Win32 版 
本 函数 没有 使 用 反 斜 杠 来 分 隔 目录 路 径 。 


gzip 和 zlib 模 块 提 供 了 对 zlib 压 缩 库 直接 访问 的 接口 。gzip 模 块 是 在 zlib 模 块 上 编写 的 ， 不 但 实 
现 了 标准 的 文件 访问 ， 还 提供 了 自动 的 gzip 压 缩 /解压 缩 bz2 类 似 于 gzip, 用 于 操作 bzip 压 缩 的 广 
件 。 

程序 员 可 以 通过 1.6 中 新 增 的 zipfile 模 块 创建 ， 人 和 修改 和 读 取 zip 归 档 文件 。 (tarfile 文 件 实现 了 针 
对 tar 归 档 文 件 的 相同 功能 ) 。 在 2.3 版 本 中 ，Python 加 入 了 导入 归档 zip 文 件 中 模块 的 功能 。 
更 多 细节 请 参阅 12.5.7 小 节 


shutil 模 块 提 供 高 级 的 文件 访问 功能 ， 包 括 复 制 文件 、 复 制 文件 的 访问 权限 、 递 归 地 目录 树 复 
制 等 。 


tempfile 模 块 用 于 生成 临时 文件 (名 ) 。 

在 关于 字符 串 一 章 中 ， 我 们 介绍 了 StringlO 模 块 (和 它 的 C 语 言 版 本 cStringlO) ， 并 且 介 绍 了 
它 是 如 何在 字符 串 对 象 顶 层 加 入 文件 操作 接口 的 。 这 个 接口 包括 文件 对 象 的 所 有 标准 方法 。 
我 们 在 前 面 永久 性 储存 一 节 (9.9 节 ) 中 介绍 的 模块 还 有 文件 和 字典 对 象 混合 样式 的 例子 。 


其 他 的 Python 类 文件 对 象 还 有 网 络 和 文件 socket 对 象 (socket 模 块 ) ， 用 于 管道 连接 的 
popen*() 文 件 对 象 《os 和 popen2 模 块 ) ， 用 于 底层 文件 访问 的 fdopen() 文 件 对 象 《os 模 
块 ) ， 通 过 URL (UniformResource Locator, 统 一 资源 定位 符 ) 建立 的 到 指定 Web 服 务 器 的 网 
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络 连接 〈urllib 模 块 ) 等 。 需 要 注意 的 是 并 非 所 有 的 标准 文件 方法 都 能 在 这 些 对 象 上 实现 ， 
样 的 ， 这 些 对 象 也 提供 了 一 些 普通 文件 没有 的 功能 。 


具体 内 容 请 参考 这 些 模块 的 相关 文档 ， 你 可 以 在 下 边 这 些 地 址 中 找到 关于 file()/open()， 文 
件 ， 文 件 对 象 的 更 多 信息 ， (这 里 我 们 还 建议 读者 参考 Python 标准 库 ， 译 者 注 ) 


http://docs.python.org/lib/built-in-flincs.html 
http://docs.python.org/lib/bltin-file-objects.html 
http://www.python.org/doc/2.3/whatsnew/node7 .html 


http://www.python.org/doc/peps/pep-0278/ 


9.11 练习 
9-1. 文 件 过 滤 。 显 示 一 个 文件 的 所 有 行 ， 忽 略 以 井 号 (HB) 开头 的 行 。 个 字符 被 用 做 
Python, Perl,Tcl, 等 大 多 脚本 文件 的 注释 符号 。 
附加 题 : 处 理 不 是 第 一 个 字符 开头 的 注释 。 
9-2. 文 件 访 问 ， 提 示 输 入 数字 N 和 文件 F 然 后 显示 文件 F 的 前 N 行 。 


9-3. 文 件 信息 ， 提 示 输 入 一 个 文件 名 ， 然 后 显 个 文本 文件 的 总 行 数 。 


同 


LIRGX 
9-4. 文 件 访问 ， 写 一 个 逐 页 显示 文本 文件 的 程序 。 提 qiue 每 次 显示 文本 文 


件 的 25 行 ， 暂 停 并 向 用 户 提 示 “ 按 任意 键 继续 "， 按 键 后 继续 执行 


9-5. 考 试 成 绩 ， 改 进 你 的 考试 成 绩 问题 (练习 5-3 和 练习 6-4) ， 要 求 能 从 多 个 文件 中 读 入 


考试 成 绩 。 文 件 的 数据 格式 由 你 自己 决定 。 


9-6. 文 件 比 较 ， 写 一 个 比较 两 个 文本 文件 的 程序 ， 如 果 不 同 ， 给 出 第 一 个 不 同 处 的 行 号 和 


列 号 。 


9-7. 解 析 文 件 。Win32 用 户 ， 创 建 一 个 用 来 解析 Windows .ini 文 件 的 程序 。POSIX 用 户 ， 


创建 一 个 解析 /etc/serves 文 件 的 程序 。 其 他 平台 用 户 ， 写 一 个 解析 特定 结构 的 系统 配置 
文件 的 程序 。 


9-8. 模 块 研究 。 提 取 模 块 的 属性 资料 。 提 示 用 户 输 入 一 个 模块 名 (或 者 从 命令 行 接受 输 
A) 。 然 后 使 用 dir() 和 其 他 内 建 函 数 提取 模块 的 属性 ， 显 示 它 们 的 名 字 、 类 型 、 值 。 


9-9.Python 文 档 字符 串 。 进 入 Python 标准 库 所 在 的 目录 。 检 查 每 个 . py f e 7r doc 
字符 事 ， 如 果 有 ， 对 其 格式 进行 适当 的 整理 归 类 。 你 的 程序 执行 完毕 后 ， 应 该 会 生成 一 
个 漂亮 的 清单 。 里 边 列 出 哪些 模块 有 文档 字符 串 ， 以 及 文档 字符 串 的 内 容 ， 清 单 最 后 附 
上 那些 没有 文档 字符 囊 模块 的 名 字 。 


附加 题 : 提取 标准 库 中 各 模块 内 全 部 类 (class) F ARL o 
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9-10. 家 庭 理 财 。 创 建 一 个 家 庭 理财 程序 。 se 
期 存款 等 多 种 账户 。 为 每 种 账户 提供 一 个 菜单 操作 界面 ， 要 有 存款 、 借 、 贷 等 操 
作 。 另 外 还 要 提供 一 个 取消 操作 选项 。 用 户 退 出 这 个 程序 时 相 a NM 
去 (出 于 备份 的 目的 ， 程 序 执行 过 程 中 也 要 备份 ) 。 


9-11.Web 站 点 地 址 。 


a) 编写 一 个 URL. 书 签 管 理 程序 。 使 用 基于 文本 的 菜单 ， 用 户 可 以 添加 、 和 修改 或 者 删 
除 书签 数据 项 、 书 签 数 据 项 中 包含 站 点 的 名 称 、URL 地 址 和 一 行 简单 说 明 (可 

选 ) 。 另 外 提供 检索 功能 ， 可 以 根据 检索 关键 字 在 站 点 名 称 和 URL 两 部 分 查找 可 能 
的 匹配 。 程 序 退 出 时 把 数据 保存 到 一 个 磁盘 文件 中 去 ; 再 次 执行 的 时 候 加 载 保存 的 
数据 。 


b) 改进 a) 的 解决 方案 ， 把 书签 输出 到 一 个 合法 且 语 法 正确 的 HTML 文 件 〈.html 或 
htm) 中 ， 这 样 用 户 就 可 以 使 用 浏览 器 查看 自己 的 书签 清单 。 另 外 提供 创建 “文件 
夹 " 功 能 ， 对 相关 的 书签 进行 分 组 管理 。 


附加 题 : 请 阅读 Python 的 re 模块 了 解 有 关 正 则 表达 式 的 资料 ， 使 用 正则 表达 式 对 用 
户 输入 的 URL 进 行 验证 。 


9-12. 用 户 名 和 密码 。 


回顾 练习 7-5, 修 改 代码 使 之 可 以 支持 $ 上 次 登录 时 间 ”。 请 参阅 time 模 块 中 的 文档 了 解 
如 何 记 录用 户 上 次 登录 的 时 间 。 另 外 提供 一 个 “系统 管理 员 ”， 它 可 以 导出 所 有 用 户 的 
用 户 名 ， 密 码 (如 果 想 要 的 话 ， 你 可 以 把 密码 加 密 ) ， 以 及 “上 次 登录 时 间 ”。 


a) 数据 应 该 保存 在 磁盘 中 ， 使 用 冒号 (:) 分 割 ， 一 次 写 入 一 行 ， 例 
如 “joe:boohoo : 953176591.145”， 文 件 中 数据 的 行 数 应 该 等 于 你 系统 上 的 用 户 数 。 


b) 进一步 改进 你 的 程序 ， 不 再 一 次 写 入 一 行 ， 而 使 用 pickle 模 块 保存 整个 数据 对 
象 。 请 参阅 poer 的 文档 了 解 如 何 序 列 化 /扁平 化 对 象 ， 以 及 如 何 读 写 保存 的 对 
象 。 一 般 来 说 ， 这 个 解决 方案 的 代码 行 数 要 比 a) 的 少 。 


c) 使 用 Shelve 模 块 替 换 pickle 模 块 ， 由 于 可 以 省 去 一 些 维护 代码 ， 这 个 解决 方案 的 代 
码 比 b) 的 更 少 。 


9-13. 命 令 行 参 数 
a) 什么 是 命令 行 参数 ， 它 们 有 什么 用 ? 
b) 写 一 个 程序 ， 打 印 出 所 有 的 命令 行 参数 。 


9-14. 记 录 结 果 ， 修 改 你 的 计算 器 程序 (练习 5-6) 使 之 接受 命令 行 参数 。 例 如 


$ calc.py 1 + 2 
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只 输出 计算 结果 。 另 外 ， 把 每 个 表达 式 和 它 的 结果 写 入 到 一 个 磁盘 文件 中 ， 当 使 用 
下 面 的 命令 时 。 


$.calec.py print 
会 把 记录 的 内 容 显 示 到 屏幕 上 ， 然 后 重 置 文件 。 这 里 是 样 全 展示 : 
? eale.py 1 + 2 

3 

5 cale:py 3 ^ 3 

2 

$ edálc.py print 

l 2 

3 

Sg 

2 

$ calc.py print 


? 


附加 题 : 处 理 输入 时 候 的 注释 。 


9-15. 复 制 文件 。 提 示 输 入 两 个 文件 名 (或 者 使 用 命令 行 参 数 ) 。 把 第 一 个 文件 的 内 容 复 
制 到 第 二 个 文件 中 去 。 
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9-16. 文 本 处 理 。 人 们 输入 的 文字 常常 超过 屏幕 的 最 大 宽度 。 编 写 一 个 程序 ， 在 一 个 文本 
文件 中 查找 长 度 大 于 80 个 字符 的 文本 行 。 从 最 接近 80 个 字符 的 单词 断 行 ， 把 剩余 文件 插 
入 到 下 一 行 处 。 程 序 执行 完毕 后 ， 应 该 没有 超过 80 个 字符 的 文本 行 了 。 


9-17. 文 本 处 理 。 创 建 一 个 原始 的 文本 文件 编辑 器 。 你 的 程序 应 该 是 菜单 驱动 的 ， 有 如 下 
这 些 选项 : 


1) 创建 文件 (提示 输入 文件 名 和 任意 行 的 文本 输入 ) 5 

2) 显示 文件 (把 文件 的 内 容 显 示 到 屏幕 ) ; 

3) 编辑 文件 (提示 输入 要 修改 的 行 ， 然 后 让 用 户 进 行 修 改 ) 5 
4) 保存 文件 ; 

5) 退出 。 


9-18 .搜索 文 件 。 提 示 输 入 一 个 字 节 值 (0255) 和 一 个 文件 名 。 显 示 该 字符 在 文件 中 出 
现 的 次 数 。 


9-19. 创 建文 件 。 创 建 前 一 个 问题 的 辅助 程序 。 创 建 一 个 随机 字 节 的 二 进 制 数据 文件 ， 但 
某 一 特定 字 节 会 在 文件 中 出 现 指定 的 次 数 。 该 程序 接受 3 个 参数 : 
1) 一 个 字 节 值 (0 一 255) $ 
2) 该 字符 在 数据 文件 中 出 现 的 次 数 ; 
3) 数据 文件 的 总 字 节 长 度 。 
你 的 工作 就 是 生成 这 个 文件 ， 把 给 定 的 字 节 随机 散布 在 文件 里 ， 并 且 要 求 保证 给 定 
字符 在 文件 中 只 出 现 指定 的 次 数 ， 文 件 应 精确 地 达到 要 求 的 长 度 。 
9-20. 压 缩 文件 。 写 一 小 段 代码 ， 压 缩 /解压 缩 gzip 或 bzip 格 式 的 文件 。 可 以 使 用 命令 行 下 
的 gzip 或 bzip2 和 GUI 程 序 PowerArchiver、Stufflt、 或 WinZip 来 确认 你 的 Python 支 持 这 两 


个 库 。 


9-21.ZIP 虹 档 文 件 。 创 建 一 个 程序 ， 可 以 往 ZIP 归 档 文件 加 入 文件 ， 或 从 中 提取 文件 ， 有 
可 能 的 话 ， 加 入 创建 ZIP 虹 档 文件 的 功能 。 


9-22.ZIP 归 档 文件 。unzip-1 命 令 显示 出 的 ZIP 昌 档 文件 很 无 趣 。 创 建 一 个 Python 脚 本 
lszip.py, 使 它 可 以 显示 额外 信息 : 压缩 文件 大 小 ， 每 个 文件 的 压缩 比率 〈 通 过 比较 压缩 前 
后 文件 大 小 ) ， 以 及 完成 的 time.ctime() 时 间 戳 ， 而 不 是 只 有 日 期 和 HH : MM ° RT : ja 
档 文件 的 date time 属 性 并 不 完整 ， 无 法 提供 给 time.mktime() 使 用 ... 这 由 你 自己 决定 ! 


9-23.TAR 归 档 文 件 。 为 TAR 归 档 文件 建立 类 似 上 个 问题 的 程序 。 这 两 种 文件 的 不 同 之 处 
在 于 ZIP 文 件 通常 是 压缩 的 ， 而 TAR 文件 不 是 ， 只 是 在 gzip 和 bzip2 的 支持 下 才能 完成 压缩 
工作 。 加 入 任意 一 种 压缩 格式 支持 。 
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附加 题 : 同时 支持 gzip 和 bzip2。 


9-24. 归 档 文 件 转 换 。 参 考 前 两 个 问题 的 解决 方案 ， 写 一 个 程序 ， 在 ZIP (zip) 和 
TAR/gzip (.tgz/.tar.gz) 或 TAR/bzip2 (.tbz/.tar.bz2) 归档 文件 间 移 动 文件 。 文 件 可 能 是 
已 经 存在 的 ， 必 要 时 请 创建 文件 。 


9-25. 通 用 解压 程序 。 创 建 一 个 程序 ， 接 受 任意 数目 的 归档 文件 以 及 一 个 目标 目录 作为 参 
数 。 归 档 文 件 格 式 可 以 是 .zip、.tgz、.tar.gz、.gz、.bz2、.tar.bz2、.tbz 中 的 一 种 或 几 

种 。 程 序 会 把 第 一 个 归档 文件 解压 后 放 入 目标 目录 ， 把 其 他 归档 文件 解压 后 放 入 以 对 应 
文件 名 命名 的 目录 下 (不 包括 扩展 名 ) 。 例 如 输入 的 文件 名 为 header.txt.gz 和 data.tgz, 目 
录 为 incoming, header.txt 会 被 解压 到 incoming 而 data.tgz 中 的 文件 会 被 放 入 
incoming/data ° 
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第 10 章 ”错误 和 异常 
本 章 主题 

e 什么 是 异常 

+ Python 中 的 异常 

4 探测 和 处 理 异常 

4 上 下 文 管理 


e 引发 异常 


e 标准 异常 
e 创建 异常 
e 相关 模块 


程序 员 的 一 生 中 ， 错 误 几 乎 每 天 都 在 发 生 。 在 过 去 的 一 个 时 期 ， 错 误 要 么 对 程序 (可 能 还 有 
机 器 ) 是 致命 的 ， 要 么 产生 一 大 堆 无 意义 的 输出 ， 无 法 被 其 他 计算 机 或 程序 识别 ， 连 程序 员 
自己 也 可 能 搞 不 懂 它 的 意义 。 一 旦 出 现 错误 ， 程 序 就 会 终止 执行 ， 直 到 错误 被 修正 ， 程 序 重 
新 执行 。 所 以 ， 人 们 需要 一 个 “柔和 ”的 处 理 错 误 的 方法 ， 而 不 是 终止 程序 。 同 时 ， 程 序 本 身 也 
在 不 断 发 展 ， 并 不 是 每 个 错误 都 是 致命 的 ， 即 使 错误 发 生 ， 编 译 器 或 是 在 执行 中 的 程序 也 可 
以 提供 更 多 更 有 用 的 诊断 信息 ， 帮 助 程序 员 尽 快 解决 问题 。 然 而 ， 错 误 毕 竟 是 错误 ， 一 般 都 
是 停止 编译 或 执行 后 才能 去 解决 它 。 一 小 段 代码 只 能 让 程序 终止 执行 ， 也 许 还 能 打印 出 一 些 
模糊 的 提示 。 当 然 ， 这 一 切 都 是 在 异常 和 异常 处 理 出 现 之 前 的 事 了 。 


虽然 目前 还 没有 讨论 到 Python 中 的 类 和 面向 对 象 编程 (OOP ) ,但 我 们 这 里 要 介绍 的 许多 概念 
已 经 涉及 了 类 和 类 实例 [1]。 我 们 提供 了 一 小 节 介 绍 如 何 创 建 自 定义 的 异常 类 。 


本 章 将 介绍 什么 是 异常 、 异 常 处 理 和 Python 对 异常 的 支持 。 我 们 还 会 介绍 如 何在 代码 里 生成 
异常 。 最 后 ， 我 们 会 涉及 如 何 创建 自 定 义 的 异常 类 。 


10.1 什么 是 异常 


10.1.1 错误 


在 深入 介绍 异常 之 前 ， 我 们 来 看 看 什么 是 错误 。 从 软件 方面 来 说 ， 错 误 是 语法 或 是 逻辑 上 
的 。 语 法 错误 指示 软件 的 结构 上 有 错误 ， 导 致 不 能 被 解释 器 解释 或 编译 器 无 法 编译 。 这 些 错 
误 必 须 在 程序 执行 前 纠正 。 


X RERO BIEGESAJS ^ AFRE CY o 9 HPARGACT SEE H TOR GARE AUEUR EU A 
AR EIE a ad de USURIS CE REDE 吉 果 需要 的 过 程 无 法 执 
行 。 这 些 错误 通常 分 别 被 称 为 域 错 误 和 范围 错误 。 


当 Python 检 测 到 一 个 错误 时 ， 解 释 器 就 会 指出 当前 流 已 经 无 法 继续 执行 下 去 。 这 时 候 就 出 现 
了 异常 。 


10.1.2 t € 


对 异常 的 最 好 描述 是 : 它 是 因为 程序 出 现 了 错误 而 在 正常 控制 流 以 外 采取 的 行为 。 这 个 行为 
又 分 为 两 个 阶段 : 首先 是 引起 异常 发 生 的 错误 ， 然 后 是 检测 (和 采取 可 能 的 措施 ) 阶段 。 


第 一 个 阶段 是 在 发 生 了 一 个 异常 条 件 (有 时 候 也 叫做 例外 的 条 件 ) 后 发 生 的 。 只 要 检测 到 错 
ee “ 件 ， 解 释 器 会 引发 一 个 异常 。 引 发 也 可 以 叫做 触发 ， 抛 出 或 者 生成 。 解 
释 器 通知 当前 控制 流 有 错误 发 生 。Python 也 允许 程序 员 自己 引发 异常 。 无 论 是 Python 
ee 员 引 发 的 ， 异 常 就 是 错误 发 生 的 信号 。 当 前 流 将 被 打 断 ， 用 来 处 理 这 个 错误 
并 采取 相应 的 操作 。 这 就 是 第 二 阶段 。 


对 异常 的 处 理发 生 在 第 二 阶段 ， 异 常 引 发 后 ， 可 以 调用 很 多 不 同 的 操作 。 可 以 是 忽略 错误 
(记录 错误 但 不 采取 任何 措施 ， 采 取 补 救 措施 后 终止 程序 ) ， 或 是 减轻 问题 的 影响 后 设法 继 
续 执行 程序 。 所 有 的 这 些 操作 都 代表 一 种 继续 ， 或 是 控制 的 分 支 。 关 键 是 程序 员 在 错误 发 生 
时 可 以 指示 程序 如 何 执行 。 


你 可 能 已 经 得 出 这 样 一 个 结论 : 程序 运行 时 发 生 的 错误 主要 是 由 于 外 部 原因 引起 的 ， 例 如 非 
法 输入 或 是 其 他 操作 失败 等 。 这 些 因素 并 不 在 程序 员 的 直接 控制 下 ， 而 程序 员 只 能 预见 一 部 
分 错误 ， 编 写 常见 的 补救 措施 代码 。 


类 似 Python 这 样 支持 引发 和 处 理 弄 常 (这 更 重要 ) 的 语言 ， 可 以 让 开发 人 员 可 以 在 错误 发 生 
时 更 直接 地 控制 它们 。 程 序 员 不 仅仅 有 了 检测 错误 的 能 力 ， 还 可 以 在 它们 发 生 时 采取 更 可 靠 
的 补救 措施 。 由 于 有 了 运行 时 管理 错误 的 能 力 ， 应 用 程序 的 健壮 性 有 了 很 大 的 提高 。 


异常 和 异常 处 理 并 不 是 什么 新 概念 。 它 们 同样 存在 于 Ada、Modula-3、C++、Eiffel 和 Java 
中 。 异 常 的 起 源 可 以 追溯 到 处 理 系 统 错误 和 硬件 中 断 这 类 异常 的 操作 系统 代码 。 在 1965 年 左 

右 ，PL/1 作 为 第 一 个 支持 异常 的 主要 语言 出 现 ， 而 异常 处 理 是 作为 一 个 它 提供 的 软件 工具 。 
和 其 他 支持 异常 处 理 的 语言 类 似 ,Python 采用 了 “尝试 (try) " 块 和 “捕获 (catching) " 块 的 概 
念 ， 而 且 它 在 异常 处 理 方面 更 有 ”纪律 性 ”。 我 们 可 以 为 不 同 的 异常 创建 不 同 的 处 理 器 ， 而 不 是 
育 目 地 创建 一 个 "捕获 所 有 (catch-all) ”的 代码 。 


10.2 Python 中 的 异常 


在 先前 的 一 些 
止 的 情况 。 你 
误 的 名 称 、 原 


章节 里 你 已 经 执行 了 一 些 人 代码， 你 一 定 遇 到 了 程序 “前 溃 ? 或 因 未 解决 的 错误 而 终 
会 看 到 “跟踪 记录 (traceback) ' bon 息 以 及 随后 解释 器 向 你 提供 的 信息 ， 包 括 错 
因 和 发 生 错 误 的 行 号 。 不 管 你 是 通过 Python 解释 器 执行 还 是 标准 的 脚本 执行 ， 


所 有 的 错误 都 符合 相似 的 格式 ， 这 提供 了 一 个 一 致 的 错误 接口 。 所 有 错误 ， 无 论 是 语意 上 的 
还 是 逻辑 上 的 ， 都 是 由 于 和 Python 解释 器 不 相 容 导 致 的 ， 其 后 果 就 是 引发 异常 。 
我 们 来 看 几 个 异常 的 例子 。 


1. NameError: 尝 试 访问 一 个 未 申明 的 变量 


>>> foo 
Traceback (innermost last): 

File "«stdin»", line 1, in ? 
NameError: name 'foo' is not defined 


NameError 表 示 我 们 访问 了 一 个 没有 初始 化 的 变量 。 在 Python 解释 器 的 符号 表 没 有 找到 那个 
另 人 讨厌 的 变量 ， 我 们 将 在 后 面 的 两 章 讨 论 名 称 空间 ， 现 在 大 家 可 以 认为 它们 是 连接 名 字 和 
对 象 的 "地址 簿 "就 可 以 了 。 任 何 可 访问 的 变量 必须 在 名 称 空 间 里 列 出 ， 访 问 变量 需要 由 解释 器 
进行 搜索 ， 如 果 请 求 的 名 字 没 有 在 任何 名 称 空间 里 找到 ， 那 么 将 会 生成 一 个 NameError 异 常 。 


2. ZeroDivisionError: 除 数 为 零 
>>> 1/0 
Traceback (innermost last): 
File "«stdin»", line 1, in ? 


我 们 边 的 例子 使 用 的 是 整 型 ， 但 事实 上 ， 任 何 数值 被 零 除 都 会 导致 一 个 ZeroDivisionError 异 


E 


"mh o 


3. SyntaxError: Python 解释 器 语法 错误 


>>> for 
File "<string>", line 1 


for 


^ 


SyntaxError: invalid syntax 
SyntaxError 异 常 是 唯一 不 是 在 运行 时 发 生 的 异常 。 它 代表 Python 代码 中 有 一 个 不 正确 的 结 
构 ， 在 它 改 正之 前 程序 无 法 执行 。 这 些 错误 一 般 都 是 在 编译 时 发 生 ，Python 解 释 器 无 法 把 你 
的 脚本 转化 为 Python 字 节 代码 。 当 然 这 也 可 能 是 你 导入 一 个 有 缺陷 的 模块 的 时 候 。 


4. IndexError: 请 求 的 索引 超出 序列 范围 


>>> aList = [] 


»»» aList[0] 


Traceback (innermost last): 
File "«stdin»", line 1l, in ? 


IndexError: list index out of range 
IndexError 在 你 尝试 使 用 一 个 超出 范围 的 值 索引 序列 时 引发 。 


5. KeyError : 请 求 一 个 不 存在 的 字典 关键 字 


>>> aDict = ('host': 'earth', 'port': 80) 
>>> print aDict['server'] 
Traceback (innermost last): 
File."«stdin»", line 1, in 2 
KeyError: server 
映射 对 象 ， 例 如 字典 ， 是 依靠 关键 字 〈key) 访问 数据 值 的 。 如 果 使 用 错误 的 或 是 不 存在 的 键 
dE Xt3L e 5] & — ^ KeyErrorar 36 » 


6. IOError: 输 入 /输出 错误 


>>> f = open("blah") 
Traceback (innermost last): 
File "«stdin»", line 1l, in ? 


IOError: [Errno 2] No such file or directory: 'blah' 


类 似 尝试 打开 一 个 不 存在 的 磁盘 文件 一 类 的 操作 会 引发 一 个 操作 系统 输入 /输出 (MO) 错误 。 
任何 类 型 的 |/O 错 误 都 会 引发 |OError 异 常 。 


7. AttributeError: 尝 试 访问 未 知 的 对 象 属性 


>>> class myClass(object): 


pass 
>> myInst myClass () 
>>> myInst.bar = 'spam' 


>>> myInst.bar 


> myInst.foo 


Traceback (innermost last): 


File "«stdin»", line i, in ? 


AttributeError: foo 


在 我 们 的 例子 中 ， 我 们 在 mylnst.bar 储 存 了 一 个 值 ， 也 就 是 实例 mylnst 的 bar 属 性 。 属 性 被 定 
义 后 ， 我 们 可 以 使 用 熟悉 的 点 /属性 操作 符 访 问 它 ， 但 如 果 是 没有 定义 属性 ， 例 如 我 们 访问 foo 
属性 ， 将 导致 一 个 AttributeError 弄 常 。 


10.3 ”检测 和 处 理 异 常 


异常 可 以 通过 try 语 名 来 检测 。 任 何在 try 语 句 块 里 的 代码 都 会 被 监测 ， 检 查 有 无 异常 发 生 。 


try 语 句 有 两 种 主要 形式 : try-except 和 try-finally。 这 两 个 语句 是 互 斥 的 ， 也 就 是 说 你 只 能 使 用 
其 中 的 一 种 。 一 个 try 语 句 可 以 对 应 一 个 或 多 个 except 子 句 ， 但 只 能 对 应 一 个 finally 子 句 ， 或 是 
— ^*try-except-finally € &-3& 4] » 


ARTT VAM A try-exceptis 6] 1 3t] fe Ab 3€ JE o pt ST A Ja — 4 9] 35 83 else-T- 6] Ab 3€ 27 A DNI 
到 异常 的 执行 的 代码 。 而 try-finally 只 允许 检测 异常 并 做 一 些 必 要 的 清除 工作 (无 论 发 生 错 误 
与 否 ) ， 没 有 任何 异常 处 理 设施 。 正 如 你 想像 的 ， 复 合 语句 两 者 都 可 以 做 到 。 

10.3.1 try-exceptié 4] 


try-excepti& 4] (以 及 其 更 复杂 的 形式 ) 定义 了 进行 异常 监控 的 一 段 代码 ， 并 且 提 供 了 处 理 异 
常 的 机 制 。 


最 常见 的 try-except 语 句 语 法 如 下 所 示 。 它 由 try 块 和 except 块 (try_suite 和 except_suite) 组 
成 ， 也 可 以 有 一 个 可 选 的 错误 原因 。 
try: 
try suite # 监 控 这 里 的 异常 
except Exception[, reason]: 
except suite # 庆 第 处 理 代码 


我 们 用 一 个 例子 说 明 这 一 切 是 如 何 工 作 的 。 我 们 将 使 用 上 边 的 IDError 例 子 ， 把 我 们 的 代码 封 
装 在 try-except 里 ， 让 代码 更 健壮 : 


. except IOError, 


print 'could not open íile:', « 


:Ould not open file: [Errno 2] No such file )r directory 


如 你 所 见 ， 我 们 的 代码 运行 时 似乎 没有 遇 到 任何 错误 。 事 实 上 我 们 在 尝试 打开 一 个 不 存在 的 
文件 时 仍然 发 生 了 IOError。 有 什么 区 别 么 ? 我 们 加 入 了 探测 和 错误 错误 的 代码 。 当 引发 
IOError 异 常 时 ， 我 们 告诉 解释 器 让 它 打 印 出 一 条 诊断 信息 。 程 序 继 续 执 行 ， 而 不 像 以 前 的 例 
子 那 样 被 * 冀 出 来 "一 一 异常 处 理 小 小 地 显 了 下 身手 。 那 么 在 代码 方面 发 生 了 什么 呢 ? 


在 程序 运行 时 ， 解 释 器 尝试 执行 try 块 里 的 所 有 代码 ， 如 果 代 码 块 完成 后 没有 弄 常 发 生 ， 执 行 
流 就 会 忽略 except 语 句 继 续 执行 。 而 当 except 语 句 所 指定 的 异常 发 生 后 ， 我 们 保存 了 错误 的 原 
> 控制 流 立即 跳 转 到 对 应 的 处 理 器 (try 子 句 的 剩余 语句 将 被 忽略 ) ， 本 例 中 我 们 显示 出 一 
个 包含 错误 原因 的 错误 信息 。 


在 我 们 上 边 的 例子 中 ， 我 们 只 捕获 IOError 措 常 。 任 何其 他 异常 不 会 被 我 们 指定 的 处 理 器 捕 
获 。 举 例 说 ， 如 果 你 要 捕获 一 个 ODSError, 你 必须 加 入 一 个 特定 的 异常 处 理 器 。 我 们 将 在 本 章 后 
面 详 细 地 介绍 try-except 语 法 。 


核心 笔记 : 忽略 代码 ， 继 续 执行 ,和 向 上 移交 


try 语 句 块 中 蜡 常 发 生 点 后 的 剩余 语句 永远 不 会 到 达 (所 以 也 永远 不 会 执行 ) 。 一 旦 一 个 异常 
被 引发 ， 就 必须 决定 控制 流下 一 步 到 达 的 位 置 。 剩 余 代 码 将 被 忽略 ， 解 释 器 将 搜索 处 理 器 ， 
一 旦 找到 ， 就 开始 执行 处 理 器 中 的 代码 。 


如 果 没 有 找到 合适 的 处 理 器 ， 那 么 异常 就 向 上 移交 给 调用 者 去 处 理 ， 这 意味 着 堆栈 框架 立即 
回 到 之 前 的 那个 。 如 果 在 上 层 调 用 者 也 没 找 到 对 应 处 理 器 ， 该 异常 会 继续 被 向 上 移交 ， 直 到 
找到 合适 处 理 器 。 如 果 到 达 最 顶层 仍然 没有 找到 对 应 处 理 器 ， 那 么 就 认为 这 个 异常 是 未 处 理 
的 ，Python 解 释 器 会 显示 出 跟踪 记录 ， 然 后 退出 。 


10.3.2 包装 内 建 函 数 


我 们 现在 给 出 一 个 交互 操作 的 例子 一 一 从 最 基本 的 错误 检测 开始 ， 然 后 逐步 改进 它 ， 增 强 代 
码 的 健壮 性 。 这 里 的 问题 是 把 一 个 用 字符 串 表 示 的 数值 转换 为 正确 的 数值 表示 形式 ， 而 且 在 
过 程 中 要 检测 并 处 理 可 能 的 错误 。 


float() 内 建 函 数 的 基本 作用 是 把 任意 一 个 数值 类 型 转换 为 一 个 浮 点 型 。 从 Python 1.5 开 始 ， 
float() 增 加 了 把 字符 串 表 示 的 数值 转换 为 浮 点 型 的 功能 ， 没 必要 使 用 string 模 块 中 的 atof() 函 
数 。 如 果 你 使 用 的 老 版 本 的 Python, 请 使 用 string.atof() 替 换 这 里 的 float() 。 


>>> float(12345) 
12345.0 

>>> f10oat('12345') 
12345.0 

>>> float('123.45e67') 
1.2345e4069 


T 3E 8 X, float() 4 A AR 9b] : 


>>> float('foo') 
Traceback (innermost last): 
File "«stdin»", line 1l, in ? 
float('foo') 
ValueError: invalid literal for float(): foo 
>>> 


LERNIS ig'. 1, 'IX8t"l) 


>>> float( 
Traceback (innermost last): 
File "«stdin»", line 1l, in ? 
floatt['this i8'; 1; 'list']) 


TypeError: float() argument must be a string or a number 


从 上 面 的 错误 我 们 可 以 看 出 ，float() 对 不 合法 的 参数 很 不 客气 。 例 如 ， 如 果 参 数 的 类 型 正确 
(字符 串 ) ， 但 值 不 可 转换 为 浮 点 型 ， 那 么 将 引发 ValueError 异 常 ， 因 为 这 是 值 的 错误 。 列 表 
也 是 不 合法 的 参数 ， 因 为 他 的 类 型 不 正确 ， 所 以 引发 一 个 TypeError 异 常 。 


我 们 的 目标 是 “安全 地 "调用 float() 函 数 ， 或 是 使 用 一 个 "安全 的 方式 "忽略 掉 错 误 ， 因 为 它们 与 我 
们 转换 数值 类 型 的 目标 没有 任何 联系 ， 而 且 这 些 错误 也 没有 严重 到 要 让 解释 器 终止 执行 。 为 

了 实现 我 们 的 目的 ， 这 里 我 们 创建 了 一 个 "封装 "函数 ， 在 try-except 的 协助 下 创建 我 们 预想 的 
环境 ， 我 们 把 他 叫做 safe_ float()。 在 第 一 次 改进 中 我 们 搜索 并 忽略 ValueError, 因 为 这 是 最 常 发 
生 的 。 而 TypeError 并 不 常见 ， 我 们 一 般 不 会 把 非 字 符 串 数据 传递 给 float()。 


def safe float(obj): 
Ur: 
return float (obj) 
except ValueError: 


pass 


我 们 采取 的 第 一 步 只 是 “止血 *。 在 上 面 的 例子 中 ， 我 们 把 错误 “ 知 了 下 去 ”。 换 和 句 话说 ， 错 误会 
被 探测 到 ， ee 名 里 没有 放任 何 东西 (除了 一 个 pass， 这 是 为 了 语法 上 的 需 
X) ， 不 进行 任何 处 理 ， 忽 略 这 个 错误 。 


这 个 解决 方法 有 一 个 明显 的 不 足 ， 它 在 出 现 错误 的 时 候 没有 明确 地 返回 任何 信息 。 虽 然 返回 
了 None ( 当 郊 数 没有 显 式 地 返回 一 个 值 时 ， 例 如 没有 执行 到 return object 语 名 函数 就 结 

了 ， 它 就 返回 None) ,我 们 并 没有 得 到 任何 关于 出 错 信息 的 提示 。 我 们 至 少 应 该 显 式 地 返回 
None, 来 使 代码 更 容易 理解 : 


def safe float(obj): 
try: 
retval - float(obj) 


except ValueError: 


retval = None 


return retval 


注意 我 们 刚才 做 的 修改 ， 我 们 只 是 添加 了 一 个 局 部 变量 。 在 有 设计 良好 的 应 用 程序 接口 

( ApplicationProgrammer Interface, API) 时 ， 返 回 值 可 以 更 灵活 。 你 可 以 在 文档 中 这 样 写 ， 
如 果 传递 给 safe _ float() 合 适 的 参数 ， 它 将 返回 一 个 浮 点 型 ; 如 果 出 现 错误 ， 将 返回 一 个 字符 
串 说 明 输 入 数据 有 什么 问题 。 我 们 按照 这 个 方案 再 修改 一 次 代码 ， 如 下 所 示 : 


def safe float(obj): 
try: 
retval = float(obj) 
except ValueError: 


retval = 'could not convert non-number to float' 


return retval 
这 里 我 们 只 是 把 None 替 换 为 一 个 错误 字符 串 。 下 面 我 们 试 试 这 个 函数 看 看 它 表现 如 何 : 
»»» safe float('12.34') 
12.34 


>>> safe float('bad input') 


'could not convert non-number to float' 


我 们 有 了 一 个 好 的 开始 一 一 现在 我 们 已 经 可 以 探测 到 非法 的 字符 囊 输入 了 ， 可 如 果 传递 的 是 
一 个 非法 的 对 象 ， 还 是 会 < 受伤”: 





»»» safe float(('a': 'Dict')) 
Traceback (innermost last): 
File "«stdin»", line 3, in ? 
retval = float(obj) 


TypeError: float() argument must be a string or a number 


我 们 暂时 只 是 指出 这 个 缺点 ， 在 进一步 改进 程序 之 前 ， 首 先 来 看 看 try-except 的 其 他 灵活 的 语 
法 ， 特 别 是 except 语 名 ， 它 有 好 几 种 变化 形式 。 


10.3.3 4$ 4 2 ^-excepti/tryi$ 4 
在 本 章 的 前 边 ， 我 们 已 经 介绍 了 except 的 基本 语法 : 
except Exception[, reason]: 


suite for exception Exception 


这 种 格式 的 except 语 句 指定 检测 名 为 Exception 的 异常 。 你 可 以 把 多 个 except 语 句 连 接 在 一 
起 ， 处 理 一 个 try 块 中 可 能 发 生 的 多 种 异常 ， 如 下 所 示 : 


except Exceptionl[, reasonl]: 
suite for exception Exceptionl 
except Exception2[, reason2]: 


suite for exception Exception2 


CHE 首先 尝试 执行 try 子 如， 如 果 没 有 错误 ， 和 忽略 所 有 的 except 从 多 继续 执行 。 如 果 发 生 异 
"o CES D uU EUM MU STU UID UNDIS PTUS 
T 7 充 将 跳 转 到 这 K 


我 们 的 safe float() 函 数 已 经 可 以 检测 到 指定 的 异常 了 。 更 聪明 的 代码 能 够 处 理 好 每 一 种 异 

常 。 这 就 需要 多 个 except 语 名 ， 人 类 型 。Python 支 持 把 except 语 
qc mad a 类 型 分 别 创建 对 应 的 错误 信息 ， 用 户 可 以 得 到 更 详细 的 关 
于 错误 的 信息 : 


def safe float(obj): 
try: 
retval = float(obj) 
except ValueError: 
retval = 'could not convert non-number to float' 
except TypeError: 
retval = 'object type cannot be converted to float' 


return retval 
使 用 错误 的 参数 调用 这 个 函数 ， 我 们 得 到 下 面 的 输出 结果 : 


>>> safe float('xyz') 

'could not convert non-number to float' 
>>> safe float(()) 

'argument must be a string' 

>>> safe float (200L) 

200.0 

>>> safe float(45.67000) 

45.67 


10.3.4 处 理 多 个 异常 的 exceptis 4] 


我 们 还 可 以 在 一 个 except 子 名 里 处 理 多 个 异常 。except 语 钨 在 处 理 多 个 异常 时 要 求 红 常 被 放 在 
一 个 元 组 里 : 
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except (Exceptionl, Exception2)[, reason]: 


suite for Exceptionl and Exception2 


上 边 的 语法 展示 了 如 何 处 理 同时 处 理 两 个 异常 。 事 实 上 except 语 句 可 以 处 理 任意 多 个 异常 ， 
前 提 只 是 它们 被 放 入 一 个 元 组 里 ， 如 下 所 示 : 


except (Excl[, Exc2[, ... EXxcN]])[, reason]: 


suite for exceptions Excl to ExcN 


如 果 由 于 其 他 原因 ， 也 许 是 内 存 规定 或 是 设计 方面 的 因素 ， 要 求 safe_float() 函 数 中 的 所 有 异 
常 必须 使 用 同样 的 代码 处 理 ， 那 么 我 们 可 以 这 样 满足 需求 : 
def safe float(obj): 
try: 
retval = float (obj) 


except (ValueError, TypeError): 


retval = 'argument must be a number or numeric string' 


return retval 
现在 ， 错 误 的 输入 会 返回 相同 的 字符 串 : 


>>> safe float('Spanish Inquisition') 
'argument must be a number or numeric string' 


>>> safe float([]) 


'argument must be a number or numeric string' 
>>> safe float('1.6") 

1.6 

>>> safe float(1.6) 

1.6 

>>> safe float(932) 

932.0 


10.3.5 捕获 所 有 异常 


使 用 前 一 节 的 代码 ， 我 们 可 以 捕获 任意 数目 的 指定 异常 ， 然 后 处 理 它们 。 如 果 我 们 想 要 捕获 
HAWAR? 当然 可 以 ! 自 版 本 1.5 后 ， 异 常 成 为 类 ， 实 现 这 个 功能 的 代码 有 了 很 大 的 改进 。 
也 因为 这 点 (异常 成 为 类 ) ， 我 们 现在 有 一 个 异常 继承 结构 可 以 遵循 。 


o 
5 
s 
X 
CD 
O 
co 


如 果 查 询 异 常 继承 的 树 结 构 ， 我 们 会 发 现 Exception 是 在 最 顶层 的 ， 所 以 我 们 的 代码 可 能 看 起 
来 会 是 这 样 : 


try: 


except Exception, e: 


# error occurred, log 'e', etc. 


另 一 个 我 们 不 太 推 荐 的 方法 是 使 用 空 except 子 名 : 


CEY: 


except: 


# error occurred, etc. 


这 个 语法 不 如 前 个 "Pythonic”。 虽 然 这 样 的 代码 捕获 大 多 异常 ， 但 它 不 是 好 的 Python 编程 样 
式 。 一 个 主要 原因 是 它 不 会 考虑 潜在 的 会 导致 异常 的 主要 原因 。 我 们 的 catch-all 语 句 可 能 不 会 
如 你 所 想 的 那样 工作 ， 它 不 会 调查 发 生 了 什么 样 的 错误 ， 如 何 避 免 它们 。 


我 们 没有 指定 任何 要 捕获 的 异常 一 这 不 会 给 我 们 任何 关于 可 能 发 生 的 错误 的 信息 。 另 外 它 

会 捕获 所 有 异常 ， 你 可 能 会 忽略 掉 重 要 的 错误 ， 正 常情 况 下 这 些 错误 应 该 让 调用 者 知道 并 做 

一 定 处 理 。 最 后 ， 我 们 没有 机 会 保存 异常 发 生 的 原因 。 当 然 ， 你 可 以 通过 sys.exc_info() 获 得 
它 ， 但 这 样 你 就 不 得 不 去 导入 sys 模 块 ， 然 后 执行 函数 一 一 这 样 的 操作 本 来 是 可 以 避免 的 ， 尤 
其 当 我 们 需要 立即 告诉 用 户 为 什么 发 生 异常 的 时 候 。 在 Python 的 未 来 版 本 中 很 可 能 不 再 支持 

"exceptf 4] (参见 “核心 风格 ") o 


关于 捕获 所 有 异常 ， 你 应 当知 道 有 些 异 常 不 是 由 于 错误 条 件 引 起 的 。 它 们 是 SystemExit 和 
KeyboardInterupt 。 SystemExit 是 由 于 当前 Python 应 用 程序 需要 退出 ，Keyboardlnterupt 代 表 
用 户 按 下 了 CTRL-C (^C) , 想 要 关闭 Python。 在 站 正 需要 的 时 候 ， 这 些 异常 却 会 被 异常 处 理 
捕获 。 一 个 典型 的 迁 回 工作 法 代码 框架 可 能 会 是 这 样 : 


try: 


except (KeyboardInterupt, SystemExit): 
# user wants to quit 
raise # reraise back to caller 
except Exception: 
# handle real errors 
关于 异常 的 一 部 分 内 容 在 Python2.5 有 了 一 些 变化 。 异 常 被 迁移 到 了 新 式 类 (new-style 
class) 上 ， 司 用 了 一 个 新 的 “所 有 异常 之 母 "， 这 个 类 叫做 BaseException, 异 常 的 继承 结构 有 了 
少许 调整 ， 为 了 让 人 们 摆脱 不 得 不 除 创 建 两 个 处 理 器 的 惯用 法 。Keyboardlnterrupt 和 
SystemExit 被 从 Exception 里 移出 和 Exception 平 级 : 
- BaseException 
|- KeyboardInterrupt 
- SystemExit 


- Exception 


|- (all other current built-in exceptions) 所 有 当前 内 建 异 常 
你 可 以 在 表 10.2 找 到 整个 异常 继承 结构 〈 变 化 前 后 ) 。 


这 样 ， 当 你 已 经 有 了 一 个 Exception 处 理 器 后 ， 你 不 必 为 这 两 个 异常 创建 额外 的 处 理 器 。 代 码 


将 会 是 这 样 : 


Cry: 


except Exception, e: 


# handle real errors 
如 果 你 确实 需要 捕获 所 有 异常 ， 那 么 你 就 得 使 用 新 的 BaseException: 


# this is really bad code 


try: 
large block of code # 大 段 代 码 的 “绷带 ” 
except Exception: # 5j except: 相同 
Pass # 忽略 所 有 错误 


当然 ， 也 可 以 使 用 不 被 推荐 的 空 except 子 多。 





核心 风格 : 不 要 处 理 并 忽略 所 有 错误 

Python 提供 给 程序 员 的 try-except 语 名 是 为 了 更 好 地 跟踪 潜在 的 错误 并 在 代码 里 准备 好 处 理 异 
常 的 逻辑 。 这 样 的 机 制 在 其 他 语言 (例如 C) 是 很 难 实现 的 。 它 的 目的 是 减少 程序 出 错 的 次 数 
并 在 出 错 后 仍 能 保证 程序 正常 执行 。 作 为 一 种 工具 而 言 ， 只 有 正确 得 当地 使 用 它 ， 才 能 使 其 
发 挥 作 用 。 

一 个 不 正确 的 使 用 方法 就 是 把 它 作 为 一 个 大 绷带 “ 绑 定 ?到 一 大 片 代 码 上 。 也 就 是 说 把 一 大 段 程 
序 (如 果 还 不 是 整个 程序 源 代码 的 话 ) 放 入 一 个 try 块 中 ， 再 用 一 个 通用 的 except 语 多 “过 滤 ?" 掉 
任何 致命 的 错误 ， 忽 略 它们 。 


Cry; 


except BaseException, e: 


# handle all errors 


很 明显 ， 错 误 无 法 避免 ，try-except 的 作用 是 提供 一 个 可 以 提示 错误 或 处 理 错误 的 机 制 ， 而 不 
是 一 个 错误 过 滤器 。 上 边 这 样 的 结构 会 忽略 许多 错误 ， 这 样 的 用 法 是 缺乏 工程 实践 的 表现 ， 
我 们 不 赞同 这 样 做 。 


底线 : 避免 把 大 片 的 代码 装 入 try-except 中 然后 使 用 pass 忽 略 掉 错误 。 你 可 以 捕获 特定 的 异常 
并 忽略 它们 ， 或 是 捕获 所 有 异常 并 采取 特定 的 动作 。 不 要 捕获 所 有 异常 ， 然 后 忽略 掉 它 们 。 


10.3.6 “ 弄 常 参数 ” 


异常 也 可 以 有 参数 ， 异 常 引 发 后 它 会 被 传递 给 异常 处 理 器 。 当 异常 被 引发 后 参数 是 作为 附加 
帮助 信息 传递 给 异常 处 理 器 的 。 虽 然 异 常 原因 是 可 选 的 ， 但 标准 内 建 异 常 提供 至 少 一 个 参 
数 ， 指 示 异 常 原因 的 一 个 字符 串 。 

异常 的 参数 可 以 在 处 理 器 里 忽略 ， 但 Python 提供 了 保存 这 个 值 的 语法 。 我 们 已 经 在 上 边 接触 
到 相关 内 容 : 要 想 访问 提供 的 异常 原因 ， 你 必须 保留 一 个 变量 来 保存 这 个 参数 。 把 这 个 参数 
放 在 except 语 句 后 ， 接 在 要 处 理 的 异常 后 面 。except 语 句 的 这 个 语法 可 以 被 扩展 为 : 


# single exception 
except Exception[, reason]: 


suite for Exception, with Argument 


# multiple exceptions 
except (Exceptioni, Exception2, ..., ExceptionN)[, reason]: 


suite for Exceptionl to ExceptionN with Argument 


reason 将 会 是 一 个 包含 来 自 导 致 异 常 的 代码 的 诊断 信息 的 类 实例 。 弄 常 参 数 自身 会 组 成 一 个 
元 组 ， 并 存储 为 类 实例 (异常 类 的 实例 ) 的 属性 。 上 边 的 第 一 种 用 法 中 ，reason 将 会 是 一 个 
Exception 类 的 实例 。 


对 于 大 多 内 建 异 常 ， 也 就 是 从 StandardError 派 生 的 异常 ， 这 个 元 组 只 包含 一 个 指示 错误 原 
的 字符 串 。 一 般 说 来 ， 姬 常 的 名 字 已 经 是 一 个 满意 的 线索 了 ， 但 这 个 错误 字符 串 会 提供 更 多 

的 信息 。 操 作 系 统 或 其 他 环境 类 型 的 错误 ， 例 如 IOError ,元 组 中 会 把 操作 系统 的 错误 编号 放 在 
错误 字符 串 前 。 


无 论 reason 只 包含 一 个 字符 串 或 是 由 错误 编号 和 字符 串 组 成 的 元 组 ， 调 用 str (reason) 总 会 
返回 一 个 良好 可 读 的 错误 原因 。 不 要 忘记 reason 是 一 个 类 实例 一 -这样 做 你 其 实 是 调用 类 的 
特殊 方法 str()。 我 们 将 在 第 13 章 探索 面向 对 象 编程 中 的 这 些 特殊 方法 。 


唯一 的 问题 就 是 某 些 第 三 方 或 是 其 他 外 部 库 并 不 遵循 这 个 标准 协议 。 我 们 推荐 你 在 引发 你 自 
己 的 异常 时 遵循 这 个 标准 (参见 核心 风格 ) 。 





核心 风格 : 遵循 异常 参数 规范 


你 在 自己 的 代码 中 引发 内 建 (built-in) 的 异常 时 ， 尽 量 遵循 规范 ， 用 和 已 有 Python 代码 一 
AEE 0 uu ur c os 
好 提供 和 解释 器 引发 ValueError 时 一 致 的 参数 信息 ， 以 此 类 推 。 这 样 可 以 在 保证 代码 一 致 性 ， 
同时 也 能 避免 其 他 应 用 程序 在 使 用 你 的 模块 时 发 生 错 误 。 


如 下 边 的 例子 ， 它 传 参 给 内 建 float 函 数 一 个 无 效 的 对 象 ， 引 发 TypeError 异 常 


>>> try: 
float(['float() does not', 'like lists', 2]) 
. except TypeError, diag:$ capture diagnostic info 


pass 


>>> type (diag) 

<class 'exceptions.TypeError'> 
>>> 

>>> print diag 


float () argument must be a string or a number 


我 们 首先 在 一 个 try 语 句 块 中 引发 一 个 异常 ， 随 后 简单 的 忽略 了 这 个 异常 ， 但 保留 了 错误 的 信 
息 。 调 用 内 置 的 type() 函 数 ， 我 们 可 以 确认 我 们 的 异常 对 象 的 确 是 TypeError 异 常 类 的 实例 。 
最 后 我 们 对 异常 诊断 参数 调用 print 以 显示 错误 。 


为 了 获得 更 多 的 关于 异常 的 信息 ， 我 们 可 以 调用 该 实例 的 class 属 性 ， 它 标示 了 实例 是 从 什么 
类 实例 化 而 来 。 类 对 象 也 有 属性 ， 比 如 文档 字符 串 〈documentation string). 和 进一步 阐明 错 
误 类 型 的 名 称 字 符 串 : 


>>> Giag # exception instance object 
«exceptions.TypeError instance at 8121378» 

>>> diag. class KR exception class object 

< exceptio ns ypeError at 80f6d5 

>>> diag. class . doc & exception class documentation string 


'Inappropriate argument type. 
^ diag. class . name # exception class name 


'TypeError' 


有 的 定义 了 文档 字符 串 的 类 中 。 


我 们 现在 再 次 来 改进 我 们 的 saft_float() 以 包含 异常 参数 ， 当 float() 发 生 异 常 时 传 给 解释 器 。 在 
前 一 次 改进 中 ， 我 们 在 一 名 话 中 同时 捕获 了 ValueError 和 TypeError 异 常 以 满足 某 些 需求 。 但 
LEARI? E cna e 种 异常 引发 了 错误 。 它 仅仅 是 返回 了 一 个 
错误 字符 串 指出 有 无 效 的 参数 。 现 在 ， 通 过 异常 参数 可 以 改善 这 种 状况 。 


因为 每 一 个 异常 都 将 生成 自己 的 异常 参数 ， 如 果 我 们 选择 用 这 个 字符 串 来 而 不 是 我 们 自 定义 


的 信息 ， 可 以 提供 一 个 更 好 的 线索 来 指出 问题 。 下 面 的 代码 片段 中 ， 我 们 用 字符 串 化 (string 
representation) 的 异常 参数 来 替换 单一 的 错误 信息 。 


l3. wget E% lr 
Python 核心 编程 第 二 版 


def safe float (object): 
try: 
retval = float(object) 
except (ValueError, TypeError), diag: 
retval = str (diag) 


return retval 


在 此 基础 上 运行 我 们 的 新 代码 ， 当 我 们 提供 safe float() 的 参数 给 不 恰当 时 ， 虽 然 还 是 只 有 一 
条 捕获 语句 ， 但 是 可 以 获得 如 下 (不 同 的 ) 信息 。 


>>> safe float('xyz') 
'invalid literal for float(): xyz' 
>>> safe float((])) 


'object can't be converted to float' 


10.3.7 在 应 用 使 用 我 们 封装 的 函数 


我 们 将 在 一 个 迷你 应 用 中 特地 的 使 用 这 个 函数 。 它 将 打开 信用 卡 交易 的 数据 文件 
(carddata.txt) ,加 载 所 有 的 交易 ， 包 括 解释 的 字符 串 。 下 面 是 一 个 示例 的 carddate.txt 文 件 : 


$ cat carddata.txt 
* carddata.txt 
previous balance 
29 

debits 


21.64 

541.24 

25 

credits 

— 9 

-541.24 

finance charge/late fees 
7.30 

5 


我 们 的 程序 cardrun.py 见 例 10.1。 
例 10.1 信用 卡 交易 系统 (cardrun.py) 


我 们 用 safe_float() 来 处 理 信用 卡 交易 文件 ， 将 其 作为 字符 串 读 入 。 并 用 一 个 日 志文 件 跟踪 处 
理 进程 。 


o ^A 
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1 #!/usr/bin/env python 
2 
3 def safe float (obj): 
4 'safe version of float()' 
5 try: 
6 retval = float(obj) 
yi except (ValueError, TypeError), diag: 
8 retval = str (diag) 
9 return retval 
10 
11 def main(): 
' 'handles all the data processing' 
log = open('cardlog.txt', 'w') 
^ i try: 

15 ccfile = open('carddata.txt', 'r') 
16 except IOError, e: 
17 log.write('no txns this month\n') 
18 log.close() 
19 return 
20 
21 txns = ccfile.readlines() 
22 ccfile.close() 
23 total = 0.00 
24 log.write('account log:Mn') 
25 
26 for eachTxn in txns: 
27 result = safe float (eachTxn) 
28 if isinstance(result, float): 
29 total += result 
30 log.write('data... processedWMn') 
31 elso: 
32 log.write('ignored: $s' % result) 
33 print '$*.2f (new balance)' $ (total) 
34 log.close() 
35 
36 if name == ' main ': 
37 main() 

逐 行 解 释 

3~9 行 


这 段 代码 是 safe_float() 函 数 的 主体 。 

11 ~ 34 行 

我 们 应 用 的 核心 部 分 有 3 个 主要 任务 : 
(1) 读 入 信用 卡 的 数据 文件 ; 
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(2) 处 理 输入 ; 


14 ~ 22 行 
从 文件 中 提取 数据 。 你 可 以 看 到 这 里 的 文件 打开 被 置 于 try-except 语 句 段 中 。 


同时 还 有 一 个 处 理 的 日 志文 件 。 在 我 们 的 例子 中 ， 我 们 假设 这 个 日 志文 件 可 以 不 出 错 的 打 
开 。 你 可 以 看 到 我 们 的 处 理 进程 伴随 着 这 个 日 志文 件 。 如 果 信 用 卡 的 数据 文件 不 能 够 被 访 
问 ， 我 们 可 以 假设 该 月 没有 信用 卡 交易 ( 行 16~19) ° 


数据 被 读 入 txns (transactions 交 易 ) 列表 ， 随 后 在 26~32 行 遍历 它 。 每 次 调用 safe float() 
后 ， 我 们 用 内 建 的 isinstance 函 数 检查 结果 类 型 。 在 我 们 例子 中 ， 我 们 检查 safe_float 是 返回 字 
符 串 还 是 浮 点 型 。 任 何 字符 串 都 意味 着 错误 ， 表 明 该 行 不 能 转换 为 数字 ， 同 时 所 有 的 其 他 数 
字 可 以 作为 浮 点 型 累加 入 total。 在 main() 有 函数 的 尾行 会 显示 最 终生 成 的 余额 。 


36 ~ 37 行 


这 两 行 通常 表明 “ 仅 在 非 导入 时 启动 "的 功能 。 运 行 我 们 程序 ， 可 以 得 到 如 下 的 输出 。 


$ cardrun.py 
$5 58.94 (new balance) 


我 们 再 看 看 log 文 件 (cardlog.txt) ,我 们 可 以 看 到 在 处 理 完 carddata.txt 中 的 交易 后 有 其 有 如 下 
的 记录 条 目 : 


$ cat cardl og.txt 

account log: 

ignored: invalid literal for float(): # carddata.txt 
ignored: invalid literal for float(): previous balance 
data... processed 

ignored: invalid literal for float(): debits 

data... processed 

data... processed 

data... processed 

ignored: invalid literal for float(): credits 

data... processed 

data... processed 

ignored: invalid literal for float(): finance charge/late fees 
data... processed 


data... processed 


10.3.8 else f 4 


我 们 已 经 看 过 else 语 句 段 配合 其 他 的 Python 语 句 ， 上 比如 条 件 和 循环 。 至 于 try-except 语 句 段 ， 
它 的 功能 和 你 所 见 过 的 其 他 else 没 有 太 多 的 不 同 : 在 try 范 围 中 没有 异常 被 检测 到 时 ， 执 行 else 
Tq: 


在 else 范 围 中 的 任何 代码 运行 前 ，try 范 围 中 的 所 有 代码 必须 完全 成 功 〈 也 就 是 ， 结 束 前 没有 
引发 异常 ) 。 下 面 是 用 Python 伪 代 码 写 的 简短 例子 。 


import 3rd party module 
log = open('logfile.txt', 'w') 


Cry: 
3rd party module.function() 
except: 
log.write("*** caught exception in module*Mn") 
else: 


log.write("*** no exceptions caught \n") 


log.close() 


在 前 面 的 例子 中 ， 我 们 导入 了 一 个 外 部 的 模块 然后 测试 是 否 有 错误 。 用 一 个 日 志文 件 来 确定 
这 个 第 三 方 模块 是 有 无 缺陷 。 根 据 运 行 时 是 否 引 发 异常 ， 我 们 将 在 日 志 中 写 入 不 同 的 消息 。 


10.3.9 finally-f- 4 


finally 子 多 是 无 论 异常 是 否 发 生 ， 是 否 捕 提 都 会 执行 的 一 段 代码 。 你 可 以 将 finally 仅 仅 配 合 try 
一 起 使 用 ， 也 可 以 和 try-except (else 也 是 可 选 的 ) 一 起 使 用 。 独 立 的 try-finally 将 会 在 下 一 章 
介绍 ， 我 们 稍 后 再 来 研究 。 


从 Python 2.5 开 始 ， 你 可 以 用 finally 子 句 (再 一 次 ) 与 try-except 或 try-except-else 一 起 使 用 。 
之 所 以 说 是 “再 一 次 "是 因为 无 论 你 相信 和 与 否 ， 这 并 不 是 一 个 新 的 特性 。 回 顾 Python 初 期 ， 这 个 
特性 早已 存在 ， 但 是 在 Python 0.9.6 (1992 4 月 ) 中 被 移 除 。 那 时 ， 这 样 可 以 简化 字 节 码 的 生 
成 ， 并 方便 解析 ， 另 外 van Rossum 认 为 一 个 标准 化 的 try-except (-else) -finally 无 论 如 何不 
会 太 流行 。 然 而 ， 十 年 时 间 改 变 了 一 切 ! 


下 面 是 try-except-else-finally 语 法 的 示例 : 


except MyException: 
B 

else: 
G 

finally: 
D 


等 价 于 Python 0.9.6 € 2.4.x 中 如 下 的 写法 : 


try: 
CE: 
A 
except MyException: 
B 
else: 
e 
finally: 
D 


当然 ， 无 论 如 何 ， 你 都 可 以 有 不 止 一 个 的 except 子 如 ， 但 最 少 有 一 个 except 语 如， 而 else 和 
finally 都 是 可 选 的 。A、B、C 和 D 是 程序 (代码 块 ) 。 程 序 会 按 预期 的 顺序 执行 。 (注意 :可 
能 的 顺序 是 A-C-D[ 正 常 ] 或 A-B-D[ 异 常 ]) 。 无 论 异 常 发 生 在 A、B 和 /或 C 都 将 执行 finally 块 。 昌 
式 写法 依然 有 效 ， 所 以 没有 向 后 兼容 的 问题 。 

10.3.10  try-finally3& 4 


另 一 种 使 用 finally 的 方式 是 finally 单 独 和 try 连 用 。 这 个 try-finally 语 名 和 try-except 区 别 在 于 它 不 
是 用 来 捕 提 异常 的 。 作 为 蔡 代 ， 它 常常 用 来 维持 一 致 的 行为 而 无 论 异 常 是 否 发 生 。 我 们 得 知 
无 论 try 中 是 否 有 异常 触发 ，finally 代 码 段 都 会 被 执行 。 


try: 
try suite 
finally: 
finally suite # 无 论 如 何 都 执行 


当 在 try 范 围 中 产生 一 个 异常 时 ， (这 里 ) 会 立即 跳 转 到 finally 语 句 段 。 当 finally 中 的 所 有 代码 
都 执行 完毕 后 ， 会 继续 向 上 一 层 引 发 异常 。 


n m A ak E dktry-except i $9try-finallyi& 4] » 3: /£ i X carddata.txt'? 1At T S65] RA 
， 我 们 可 以 在 cardrun.py 的 这 一 处 ynally 句 段 来 改进 代码 。 在 当前 示例 10.1 的 代码 
i 我 们 在 读 取 阶段 没有 探测 到 错误 (通过 readlines()) 。 
try: 
ccfile = open('carddata.txt') 


except IOError: 


log.write('no txns this month\n 


txns = ccfile.readlines() 
ccfile.close() 


但 有 很 多 原因 会 导致 readlines() 失 败 ， 其 中 一 种 就 是 carddata.txt 存 在 于 网 络 (或 软盘 ) 上 ， 
但 是 变 得 不 能 读 取 。 无 论 怎 样 ， 我 们 可 以 把 这 一 小 段 读 取 数 据 的 代码 整个 放 入 try 子 名 的 范围 


A 


try: 
ccfile = open('carddata.txt', 'r') 
txns = ccfile.readlines() 
ccfile.close|() 
except IOError: 
log.write('no txns this monthMWn') 
我 们 所 做 的 一 切 不 过 是 将 readline() 和 close() 方 法 调用 都 移入 了 try 语 多 段 。 尽 管 我 们 代码 变 得 
更 加 的 健壮 了 ， 但 还 有 改进 的 空间 。 注 意 如 果 按 照 这 样 的 顺序 发 生 错 误 : 打开 成 功 ， 但 是 出 
于 一 些 原因 readlines() 调 用 失败 ， 异 常 处 理会 去 继续 执行 except 中 的 子 句 ， 而 不 去 尝试 关闭 文 
件 。 难 道 没 有 一 种 好 的 方式 来 关闭 文件 而 无 论 错误 是 否 发 生 ?我 们 可 以 通过 try-finally 来 实现 : 
try: 
try: 
ccfile = open('carddata.txt', 'r') 
txns = ccfile.readlines() 
except IOError: 
log.write('no txns this month\n') 
finally: 
ccfile.close() 
代码 片段 会 尝试 打开 文件 并 且 读 取 数 据 。 如 果 在 其 中 的 某 步 发 生 一 个 错误 ， 会 写 入 日 志 ， 随 
后 文件 被 正确 的 关闭 。 如 果 没 有 错误 发 生 ， 文 件 也 会 被 关闭 (同样 的 功能 可 以 通过 上 面 标准 
16, &jtry-except-finallyi& 4] Bt S: 3L) 。 另 一 种 可 选 的 实现 切换 了 try-except 和 try-finally 包 含 的 方 
式 ， 如 : 


Ery: 
try: 
ccfile = open('carddata.txt', 'r') 
txns = ccfile.readlines() 
finally: 


ccfile.close() 
except IOError: 


log.write('no txns this monthMn') 


代码 本 质 上 千 的 是 同一 种 工作 ， 除 了 一 些小 小 的 不 同 。 最 显著 的 是 关闭 文件 发 生 在 异常 处 理 
器 将 错误 写 入 日 志 之 前 。 这 是 因为 finally 会 自动 的 重新 引发 异常 


这 样 写 的 一 个 理由 是 如 果 在 finally 的 语句 块 内 发 生 了 一 个 异常 ， 你 可 以 创建 一 个 同 现 有 的 异常 
处 理 器 在 同一 个 (外 ) 层次 的 异常 处 理 器 来 处 理 它 。 这 样 ， 从 本 质 上 来 说 ， 就 可 以 同时 处 理 

在 原始 的 try 语 句 块 和 finally 语 句 块 中 发 生 的 错误 。 这 种 方法 唯一 的 问题 是 ， 当 finally 语 句 块 中 

的 确 发 生 蜡 常 时 ， 你 会 丢失 原来 异常 的 上 下 文 信息 ， 除 非 你 在 某 个 地 方 保存 了 它 。 


反对 这 种 写法 的 一 个 理由 是 : 在 很 多 情况 下 ， 异 常 处 理 器 需要 做 一 些 扫尾 工作 ， 而 如 果 你 在 
异常 处 理 之 前 ， 用 finally 语 句 块 中 释放 了 某 些 资源 ， 你 就 不 能 再 去 做 这 项 工作 了 。 简 单 地 说 ， 
finally 语 句 块 并 不 是 如 你 所 想 的 是 “最 终 的 (final) "了 。 


一 个 最 终 的 注意 点 : 如 果 finally 中 的 代码 引发 了 另 一 个 异常 或 由 于 return、break、continue 语 
法 而 终止 ， 原 来 的 异常 将 丢失 而 且 无 法 重新 引发 。 


10.3.11 try-except-else-finally : 局 局 E 
我 们 综合 了 这 一 章 目前 我 们 所 见 过 的 所 有 不 同 的 可 以 处 理 异 常 的 语法 样式 : 
try: 


try suite 


except Exceptionl: 


suite for Exceptioni 


except (Exception2, Exception3, Exception4): 


A 


suite for Exceptions 2 3 and 4 


except Exception5, Argument5: 


suite for Exception5 plus argument 


except (Exceptionó, Exception7), Argumentó7: 


suite for Exceptions6 and 7 plus argument 


except: 


suite for all other exceptions 


else: 


no exceptions detected suite 


finally: 


always execute suite 


回顾 上 面 ，finally 子 名 和 try-except 或 try-except-else 联 合 使 用 是 Python 2.5 的 “新 "有 的 。 这 一 
节 最 重要 的 是 无 论 你 选择 什么 语法 ， 你 至 少 要 有 一 个 except 子 句 ， 而 else 和 finally 都 是 可 选 
的 。 


10.4 上 下 文 管理 


10.4.1 with 4 


如 上 所 述 的 标准 化 ia except 和 try-finally 可 以 使 得 程序 更 加 “Pythonic”， 其 含义 是 ， 在 许多 的 
其 他 特性 之 外 ， 写 得 更 加 轻松 ， 读 得 自在 。Python 对 隐藏 细节 已 经 做 了 大 量 的 工作 ， 因 此 需 
要 你 操心 的 仅 是 如 何 解决 你 所 遇 到 的 问题 〈 你 能 假想 移植 一 个 复杂 的 Python 应 用 到 C++ 或 
Java ? ) 。 


另 一 个 隐藏 低层 次 的 抽象 的 例子 是 with 语句 ， 它 在 Python 2.6 中 正式 启用 (Python2.5 尝 试 性 
的 引入 了 with， 并 对 使 用 with 作为 标识 符 的 应 用 程序 发 出 这 样 的 警告 
with 将 会 成 为 关键 字 。 如 果 你 想 在 Python 2.5 使 用 with 语句 ， 你 必须 用 from__future poe 
with statement-k AZ) 。 





类 似 于 try-except-finally ，with 语 句 也 是 用 来 简化 代码 的 ， 这 与 用 try-except 和 try-finally 所 想 达 
到 的 目的 前 后 呼应 。try-except 和 try-finally 的 一 种 特定 的 配合 用 法 是 保证 共享 的 资源 的 唯一 分 
配 ， 并 在 任务 结束 的 时 候 释放 它 。 比 如 文件 (数据 、 日 志 、 数 据 库 等 等 )、 线 程 资源 、 简 单 
同步 、 数 据 库 连 接 ， 等 等 。with 语 名 的 目标 就 是 应 用 在 这 种 场景 。 


然而 ，with 语 名 的 目的 在 于 从 流程 图 中 把 try、except 和 finally 关 键 字 和 资源 分 配 释放 相关 代码 
统统 去 掉 ， 而 不 是 像 try-except-finally 那 样 仅 仅 简化 代码 使 之 易 用 。with 语 法 的 基本 用 法 如 
Tz 


with context_expr [as var]: 
with_suite 


看 起 来 如 此 简单 ， 但 是 其 背后 还 有 一 些 工作 要 做 。 这 并 不 如 看 上 去 的 那么 容易 ， 因 为 你 不 能 
对 Python 的 任意 符号 使 用 with 语句 。 它 仅 能 工作 于 支持 上 下 文 管理 协议 (context 
managementprotocol) 的 对 象 。 这 显然 意味 着 只 有 内 建 了 "上下文 管理 "的 对 象 可 以 和 with 一 起 
工作 。 我 们 过 一 会 再 来 阐明 它 的 含义 。 


现在 ， 正 如 一 个 新 的 游戏 硬件 ， 每 当 有 一 个 新 的 特性 推出 时 ， 第 一 时 间 总 有 人 开发 出 相应 的 
新 游戏 ， 从 而 你 打开 盒子 就 可 以 开始 玩 了 。 类 似 ， 目 前 已 经 有 了 一 些 支 持 该 协议 的 对 象 。 下 
面 是 第 一 批 成 员 的 简短 列表 : 


e file 


e decimal.Context 

e thread.LockType 

e threading.Lock 

e threading.RLock 

e threading.Condition 

e threading.Semaphore 

e threading.BoundedSemaphore 
既然 fle 是 上 面 的 列表 上 的 第 一 个 也 是 最 易于 演示 的 ， 下 面 就 给 出 一 段 和 with 一 起 使 用 的 代码 
片段 。 

with open('/etc/passwd', 'r') as f: 

for eachLine in f: 
# ...do stuff with eachLine or f... 

这 个 代码 片段 干 了 什么 呢 ， 这 是 Python, 因 而 你 很 可 能 已 经 猜 到 了 。 它 会 完成 准备 工作 ， 比 如 
试图 打开 一 个 文件 ， 如 果 一 切 正常 ， 把 文件 对 象 赋值 给 f. Dp RE ed 文件 中 的 每 一 行 ， 


当 完 成 时 ， 关 闭 文件 。 无 论 的 在 这 一 段 代码 的 开始 ， 中 间 ， 还 是 结束 时 发 生 异 常 ， 会 执行 清 
理 的 代码 ， 此 外 文件 仍 会 被 自动 的 关闭 。 


因为 已 经 从 你 手边 拿 走 了 一 堆 细节 ， 所 以 实际 上 只 是 进行 了 两 层 处 理 : 





第 一 ， 发 生 用 户 层 一 一 和 in 类 似 ， 你 所 需要 关心 的 只 是 被 使 用 的 对 象 ; 


， 在 对 象 层 。 了 既然 这 个 对 象 支持 上 下 文 管理 协议 ， 它 干 的 也 就 是 "上 下 文 管理 "。 


10.4.8 * 上 下 文 管理 协议 
除非 你 打算 自 定义 可 以 和 with 一 起 工作 的 类 ， 比 如 : 别 的 程序 员 会 在 他 们 的 设计 的 应 用 中 使 用 
你 的 对 象 。 绝 大 多 数 Python 程序 员 仅仅 需要 使 用 with 语句 ， 可 以 跳 过 这 一 节 。 


我 们 不 打算 在 这 里 对 上 下 文 管 理 做 深入 且 详 细 的 探讨 ， 但 会 介绍 兼容 协议 所 必须 的 对 象 类 型 
与 功能 ， 使 其 能 和 with 一 起 工作 。 
前 面 ， 我 们 在 例子 中 描述 了 一 些 关于 协议 如 何 和 文件 对 象 协 同 工 作 。 让 我 们 在 此 进一步 地 研 


究 。 


1. 上 下 文 表达 式 (context expr) ， 上 下 文 管理 器 


当 with 语 句 执行 时 ， 便 执行 上 下 文 符号 ( 译 者 注 : 就 是 with 与 as 间 内 容 ) 来 获得 一 个 上 下 文 管 
理 器 。 上 下 文 管理 器 的 职责 是 提供 一 个 上 下 文 对 象 。 这 是 通过 调用 context () 方 法 来 实现 
的 。 该 方法 返回 一 个 上 下 文 对 象 ， 用 于 在 with 语 句 块 中 处 理 细 节 。 有 点 需要 注意 的 是 上 下 文 对 
象 本 身 就 可 以 是 上 下 文 管理 器 。 所 以 contextexpr 既 可 以 为 一 个 站 正 的 上 下 文 管理 器 ， 也 可 以 
是 一 个 可 以 自我 管理 的 上 下 文 对 象 。 在 后 一 种 情况 时 ， 上 下 文 对 象 仍然 有 \_ context () 方 法 ， 
返回 其 自身 ， 如 你 所 想 。 


2. 上 下 文 对 象 ，with 语 句 块 


一 旦 我 们 获得 了 上 下 文 对 象 ， 就 会 调用 它 的 ”enter() 方法。 它 将 完成 with 语 句 块 执 行 前 的 
所 有 准备 工作 。 你 可 以 注意 到 在 上 面 的 with 行 的 语法 中 有 一 个 可 选 的 as 声明 变量 跟随 在 
contextexp/ 之 后 。 如 果 提 供 提 供 了 变量 ， 以 Uenter_() 返 回 的 内 容 来 赋值 ; GI RARE 
值 。 在 我 们 的 文件 对 象 例子 中 ， 上 下 文 对 象 的 ”enter () 返 回 文件 对 象 并 赋值 给 f。 


现在 ， 执 行 了 with 语句 块 。 当 with 语句 块 执 行 结束 ， 无 论 是 和谐 地 "还 是 由 于 异常 ， 都 会 调用 
上 下 文 对 象 的 ”exit () 方 法 。 ext () 有 三 个 参数 。 如 果 Wwith 语 句 块 正 常 结束 ， 三 个 参数 全 
部 是 None。 如 果 发 生 异 常 ， 三 个 参数 的 值 的 分 别 等 于 调用 Sys.exc_info() 函 数 ( 见 10.12) 3& 
回 的 三 个 值 : 类 型 (AEX) 、 值 (异常 实例 ) 和 跟踪 记录 (traceback) ,相应 的 跟踪 记录 对 
象 。 


你 可 以 自己 决定 如 何在 ”Exit _() 里 面 处 理 异 常 。 惯 例 是 当 你 处 理 完 异常 时 不 返回 任何 值 ， 或 
返回 None, 或 返回 其 他 布尔 值 为 False 对 象 。 这 样 可 以 使 异常 抛 给 你 的 用 户 来 处 理 。 如 果 你 明 

确 地 想 屏 蔽 这 个 异常 ， 返 回 一 个 布尔 为 True 的 值 。 如 果 没 有 发 生 有 异常 或 你 在 处 理 异 常 后 返回 

True, 程 序 会 继续 执行 With 子 句 后 的 下 一 段 代码 。 


为 上 下 文 管理 器 主要 作用 于 共享 资源 ， 你 可 以 想象 到 ente ()fe exit () 方 法 基本 是 干 
的 需要 分 配 和 释放 资源 的 低层 次 工作 ， 比 如 : 数据 库 连 接 、 锁 分 配 、 信 号 量 加 减 、 状 态 管 
理 、 打 开 /关闭 文件 、 异 常 处 理 等 。 


为 了 帮助 你 编写 对 象 的 上 下 文 管理 器 ， 有 一 个 contextlib 模 块 ， 包 含 了 实用 的 
functions/decorators, 你 可 以 用 在 你 的 函数 /对 象 上 而 不 用 去 操心 关于 类 或 ”context ()^ 
. enter ()^ enter ()fe exit () 这 些 方法 的 实现 。 


想 了 解 更 多 关于 上 下 文 管理 器 的 信息 ， 请 查看 官方 的 Python 文档 的 with 语法 和 contextlib 模 


块 、 类 的 指定 方法 (与 with 和 contexts 相 关 的 ) 、PEP 343 和 《What's New in Python 2.5 
(Python 2.5 的 更 新 ) 》 的 文档 。 


10.5 * 字 符 串 作为 异 第 


早 在 Python 1.5 前 ， 标 准 的 异常 是 基于 字符 串 实现 的 。 然 而 ， 这 样 就 限制 了 异常 之 间 不 能 有 相 
互 关系 。 这 种 情况 随 着 异常 类 的 来 临 而 不 复 存 在 。 到 1.5 为 止 ， 所 有 的 标准 异常 都 是 类 了 。 程 
序 员 还 是 可 以 用 字符 串 作 为 自己 的 异常 的 ， 但 是 我 们 建议 从 现在 起 使 用 异常 类 。 


为 了 向 后 兼容 性 ， 还 是 可 以 启用 基于 字符 串 的 异常 。 从 命令 行 以 -X 为 参数 启动 Python 可 以 提 
供 你 字符 串 方式 的 标准 异常 。 从 Python1.6 起 这 个 特性 被 视 为 废弃 的 。 


Python 2.5 开 始 处 理 向 来 不 赞成 使 用 的 字符 串 异 常 。 在 2.5 中 ， 触 发 字符 串 异 常会 导致 一 个 警 
告 。 在 2.6， 捕 获 字 符 串 异常 会 导致 一 个 警告 。 由 于 它 很 少 被 使 用 而 且 已 经 被 废弃 ， 我 们 将 不 
再 在 本 书 范 围 内 考虑 字符 串 异 常 并 且 已 经 去 除 相关 文字 。 (在 本 书 的 早期 版 本 中 你 会 找到 这 
些 ) 。 唯 一 也 是 最 后 的 中 肯 警 告 是 : 你 可 能 用 到 仍然 使 用 着 字符 串 异 常 的 外 部 或 第 三 方 的 模 
块 。 字 符 囊 弄 常 总 而 言 之 是 一 个 糟糕 的 想法 ， 读 者 可 以 回想 ， 有 着 拼写 错误 的 Linux RPM 弄 常 
如 在 限 前 。 


10.6 触发 异常 


到 目前 为 止 ， 我 们 所 见 到 的 异常 都 是 由 解释 器 引发 的 。 由 于 执行 期 间 的 错误 而 引发 。 程 序 员 
在 编写 API 时 也 希望 在 遇 到 错误 的 输入 时 触发 异常 ， 为 此 ，Python 提 供 了 一 种 机 制 让 程序 员 明 
确 的 触发 异常 ， 这 就 是 raise 语 如。 


raisei& 4] 
1.i& ik 5 d A 


raise 语 名 对 所 支持 是 参数 十 分 灵活 ， 对 应 到 语法 上 就 是 支持 许多 不 同 的 格式 。rasie 一 般 的 用 
法 是 : 


raise [SomeException [, args [, traceback]]] 


第 一 个 参数 ，SomeExcpetion, 是 触发 异常 的 名 字 。 如 果 有 ， 它 必须 是 一 个 字符 串 ， 类 或 实例 
( 详 见 下 文 ) 。 如 果 有 其 他 参数 (arg 或 traceback) ,就 必须 提供 SomeExcpetion.Python 所 有 
的 标准 异常 见 表 10.2。 


第 二 个 符号 为 可 选 的 args (比如 参数 ， 值 ) ， 来 传 给 异常 。 这 可 以 是 一 个 单独 的 对 象 也 可 以 
是 一 个 对 象 的 元 组 。 当 异常 发 生 时 ， 异 常 的 参数 总 是 作为 一 个 元 组 传 入 。 如 果 args 原 本 就 是 
元 组 ， 那 么 就 将 其 传 给 异常 去 处 理 ; 如 果 args 是 一 个 单独 的 对 象 ， 就 生成 只 有 一 个 元 素 的 元 
组 (就 是 单元 素 元 组 ) 。 大 多 数 情况 下 ， 单 一 的 字符 串 用 来 指示 错误 的 原因 。 如 果 传 的 是 元 
组 ， 通 常 的 组 成 是 一 个 错误 字符 串 、 一 个 错误 编号 ， 可 能 还 有 一 个 错误 的 地 址 ， 比 如 文件 ， 


A HM 


等 等 。 


最 后 一 项 参数 ，traceback, 同 样 是 可 选 的 (实际 上 很 少 用 它 ) 。 如 果 有 的 话 ， 则 是 当 弄 常 触发 
时 新 生成 的 一 个 用 于 异常 -正常 化 (exception 一 normally) 的 跟踪 记录 (traceback) 对 象 。 当 
你 想 重新 引发 异常 时 ， 第 三 个 参数 很 有 用 (可 以 用 来 区 分 先前 和 当前 的 位 置 ) 。 如 果 没 有 这 
个 参数 ， 就 填写 None。 


最 常见 的 用 法 为 SomeException 是 一 个 类 。 不 需要 其 他 的 参数 ， 但 如 果 有 的 话 ， 可 以 是 一 个 
单一 对 象 参 数 ， 一 个 参数 的 元 组 ， 或 一 个 异常 类 的 实例 。 如 果 参 数 是 一 个 实例 ， 可 以 由 给 出 
的 类 及 其 派生 类 实例 化 (已 存在 异常 类 的 子 集 ) 。 若 参数 为 实例 ， 则 不 能 有 更 多 的 其 他 参 


AX o 
2. 更 多 的 特殊 /少见 的 惯用 法 


当 参 数 是 一 个 实例 的 时 候 会 发 生 什么 呢 ? 该 实例 若是 给 定 异 常 类 的 实例 当然 不 会 有 问题 。 然 
而 ， 如 果 该 实例 并 非 这 个 异常 类 或 其 子 类 的 实例 时 ， 那 么 解释 器 将 使 用 该 实例 的 异常 参数 创 
建 一 个 给 定 异 常 类 的 新 实例 。 如 果 该 实例 是 给 定 异 常 类 子 类 的 实例 ， 那 么 新 实例 将 作为 异常 
类 的 子 类 出 现 ， 而 不 是 原来 的 给 定 异 常 类 


如 果 raise 语 名 的 额外 参数 不 是 一 个 实例 一 一作 为 替代 ， 是 一 个 单 件 (singleton ) 3 
那么 ， 将 用 这 些 作为 此 异常 类 的 初始 化 的 参数 列表 。 如 果 不 存在 第 二 个 参数 或 是 None， 则 参 
数列 表 为 空 。 





如 果 SomeException 是 一 个 实例 ， 我 们 就 无 需 对 什么 进行 实例 化 了 。 这 种 情况 下 ， 不 能 有 额 
外 的 参数 或 只 能 是 None。 异 常 的 类 型 就 是 实例 的 类 ; 也 就 是 说 ， 等 价 于 触发 此 类 异常 ， 并 用 
该 实例 为 参数 ， 比 如 raise instance. class instance ° 


我 们 建议 用 异常 类 ， 不 赞成 用 字符 串 异 常 。 但 如 果 用 字符 串 作 为 SomeException, 那 么 会 触发 
一 个 用 字符 串 标识 的 异常 ， 还 有 一 个 可 选 的 参量 (args) 作 参 数 。 

最 后 ， 这 种 不 含 任何 参数 的 raise 语 句 结构 是 在 Pythonl.5 中 新 引进 的 ， 会 引发 当前 代码 块 
(code block) 最 近 和 触发 的 一 个 异常 。 如 果 之 前 没有 异常 触发 ， 会 因为 没 可 以 有 重新 触发 的 异 
dí m E S — ^* TypeErrorat 9$ ° 


由 于 raise 有 许多 不 同 格式 有 效 语法 (比如 : SomeException 可 以 是 类 ， 实 例 或 一 个 字符 
$) ， 我 们 提供 表 10.1 来 阐明 rasie 的 不 同 用 法 。 








表 10.1 raise 语句 的 用 法 
ne i Tt i 
rasie 语法 E af 
raise exclass 击发 一 个 异常 ， 从 exclass 生成 一 个 实例 (不 ^i HHR) 
-— = PT , mma 不 是 类 ， BHmEOHMITT (function callopeaton “0”) 作用 于 类 名 和 全 
战 一 个 新 的 exclass 实例 ，。 同 样 也 没有 异常 参数 
iA vilie exclaxs, args 4 k, "T J 时 提供 的 界 过 参数 args, HOLE 个 参数 也 可 以 是 元 姐 
+ a 





raise exclass(args) 3) | 














raise exclars, args. (b 目 上 ， 但 提供 一 个 跟踪 记录 (tracebhack ) 对 象 由 供 使 用 
aiiud MM S GARIE exclass 的 实例 ) ; 知 果 实例 是 exclass OTRA., Wart 
raise exclass, instance Kk 8X RE TOSNS CRI exclass? ; 如 果实 例 茎 不 是 exclass. 的 实例 也 不 是 
exclass 子 类 的 实例 ， 那 么 会 复制 此 实例 为 异常 参数 卖 生成 一 个 新 的 exclass 实例 
apes m X. 异常 类型 是 实例 的 尖 形 ; 等 价 于 raiseinstance. class. instance 
raise Mfce -- 
raise string dud uxzryumnmS 
raise string. args 站 上 上 上， 但 触发 伟 随 着 arg 
raise string. args, ib TE., MEAT daii 记录 raceback ) 对 象 由 供 使 用 
LL 
raise L5 gum EN MX WAAR., t NN. M TypeErroc 














10.7 断言 


B A 6] o ETT TR ARORSDE: 此 外 ， 发 生 异 常 也 意味 着 表达 式 为 假 。 这 些 工 作 类 似 
于 C 语 言 预 处 理 器 中 assert 宏 ， 但 在 Python 中 它们 在 运行 时 构建 (与 之 相对 的 是 编译 期 判 
别 ) o 


Jte RRNA Ro] HEART 3C BLAZER X A o BE CST VAS fap 3e 3E 89 28 $7] raise-ifi& e (更 准确 
& JG x raise-if-noti& 4] ) 。 测 试 一 个 表达 式 ， 如 果 返 回 值 是 假 ， 触 发 异常 。 


断言 通过 assert 语 名 实现 ， 在 1.5 版 中 引入 。 
断言 语句 
断言 语句 等 价 于 这 样 的 Python 表 达 式 ， 如 果断 言 成 功 不 采取 任何 措施 (类似 语 句 ) ， 否 则 触 
发 AssertionError (断言 错误 ) 的 异常 .assert 的 语法 如 下 : 
assert expression[; arguments] 


TRAR m assert 8938 4] : 


assert ] -- 
assert 2 + 2 -- * 2 
assert len(['my list', 12]) « 10 


assert range(3) -- [0, 1, 2] 
AssertionError-Jt ?& Fe X 4685 A i—i T Vf try-exceptis 4] RAR’ de Ide I DER A C o CH 
终止 程序 运行 而 且 提供 一 个 如 下 的 跟踪 记录 : 
>>> assert 1 == 0 
Traceback (innermost last): 
File "«stdin»", line 1, in ? 


AssertionError 
如 同 先前 章节 我 们 研究 的 raise 语 名， 我 们 可 以 提供 一 个 异常 参数 给 我 们 的 assert 命 令 : 


>>> assert 1 -- 0, 'One does not equal zero silly!' 
Traceback (innermost last): 
File "«stdin»", line 1l, in ? 


AssertionError: One does not equal zero silly! 


下 面 是 我 们 如 何 用 try-except 语 名 捕获 AssertionError 异 常 : 


try: 
assert 1 -- 0, 'One does not equal zero silly!' 
except AssertionError, args: 


rint '$s: $s' $ (args. class . name , args) 
P g 


从 命令 行 执行 上 面 的 代码 会 导致 如 下 的 输出 : 


AssertionError: One does not equal zero silly! 


为 了 让 你 更 加 了 解 assert 如 何 适 作 ， 想 象 一 下 断言 语句 在 Python 中 如 何 用 函数 实现 。 可 以 像 下 
面 这 样 : 
def assert(expr, args-None): 
if _ debug . and not expr: 
raise AssertionError, args 
此 处 的 if 语 句 检 查 assert 的 语法 是 否 合适 ， 也 就 是 expr 必 须 是 一 个 表达 式 。 我 们 比较 expr 的 类 
型 鼻 正 的 表达 式 来 确认 。 函 数 的 第 二 部 分 对 表达 式 求 值 然 后 根据 结果 选择 性 的 引发 异常 。 


内 建 的 变量 debug 在 通常 情况 下 为 True, 如 果 开 局 优化 后 为 False (命令 行 选项 -O) (Python 
2.2 后 为 布尔 值 True 和 False) ° 


10.8 标准 异常 


表 10.2 列 出 了 所 有 的 Python 当 前 的 标准 异常 集 ， 所 有 的 异常 都 是 内 建 的 。 所 以 它们 在 脚本 启 
动 前 或 在 互 交 命令 行 提 示 符 出 现时 已 经 是 可 用 的 了 。 











表 10.2 Python 内 建 异 常 
| 
BaseExcepion’ i T BERE OR l 
SystemExit" | python 18 ff 28 UAR LH = r 





Keyboardinterrupt HEPERI REAC) 





o x 


Python 核心 编程 第 二 版 





第 10 章 ”错误 和 异常 


um 


Rs nom 

is se v eon 

生成 器 (generator) XE WS X08 o ni 
Python WR SHERU 

Ati e AN ORE WERE CN 

Fifi vni vun am won 

mei qax 

数值 运算 超出 最 大 限制 

Ak OREURD E (ORIGO 
LII EA d 

对 象 没 有 这 个 局 性 

设 有 内 建 揽 入 ， 到 达 EOF 标记 
Wr sema com 
RAAHE ACRI 

Wn mt 

Windows t$ 0] AU 
PAMAN RRE 

用 户 中 新 执 征 通常 是 输入 ^C》 
KAR CAE OS 

序列 中 没有 役 有 此 震 引 (index) 
聘 财 中 没有 这 个 键 

AURIE OIF Python FERES EC 00 
未 声明 /初始 化 对 象 〈 没 有 属性 》 
io FLA MM UM A RENE 

$8417]. (Weak reference) 试图 访问 已 经 粒 级 回 妆 了 的 对 象 
一 般 的 运行 时 畏 避 

尚未 实现 的 方法 

Python iic t 

mmn 

Tab foei 

一 般 的 解释 器 系统 悄 误 

ADR ROCCO HY 

传 入 无 效 的 参数 
Unicode 相关 的 情 误 
Unicode 解码 时 的 错误 
Unicode i APER 

Unicode VRBE UR 


390 


* uH 





Waming | 25x 
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Python2.5 新 二 


b. fF Python2.5 前，Exeefxion f] FA SystemExit 

在 Pythoa2.5 W. StandardErmor 的 了 类 Keyboandlnterrupt 
d. Pythonl.S Bf. "ACTAS ROM ICE TAI 
e. Python22 新 增 


f. Pythoni.6 SS 


. Python2.0 新 增 


zm 的 


. Pythont.6 Bum 
i. Python2.3 新 增 
, Python2.1 新 增 


k. Python2.2 Sif. WIFE Python2.4 时 移民 


所 有 的 标准 /内 建 异 常 都 是 从 根 异 常 派生 的 o H 前 , 有 3 个 直接 从 BaseException 派 生 的 异常 子 
X : SystemExit, Keyboardinterrupt 和 Exception。 其 他 的 所 有 的 内 建 异 常 都 是 Exception 的 子 
类 。 表 10.2 中 的 每 一 层 缩 进 都 代表 一 次 异常 类 的 派生 。 


到 了 Python2.5， 所 有 的 异常 的 都 是 新 式 类 ， 并 且 最 终 都 是 BaseException 的 子 类 。 在 这 一 版 
中 ，SystemExit 和 Keyboardlnterrupt 从 Exception 的 继承 中 移 到 BaseException 的 继承 中 ， 这 
样 可 以 允许 如 except Exception 的 语句 捕获 所 有 非 控 制程 序 退 出 的 异常 。 


从 Pythonl.5 到 Python2.4.x， 弄 常 是 标准 的 类 ， 在 这 之 前 ， 他 们 是 字符 囊 。 从 Python2.5 开 
始 ， 不 再 支持 构建 基于 字符 串 的 异常 并 且 被 正式 的 弃 用 ， 也 就 是 说 你 不 能 再 触发 一 个 字符 串 
异常 了 。 在 2.6， 你 将 不 能 捕获 他 们 。 还 有 一 个 要 求 就 是 所 有 新 的 异常 最 终 都 是 
BaseException 的 子 类 ， 以 便于 他 们 有 一 个 统一 的 接口 。 这 将 从 Python2.7 开 始 ， 并 在 余下 的 
Python2.x 发 布 版 中 延续 。 


10.9 RRF 


尽管 标准 异常 集 包 含 的 内 容 已 经 相当 广泛 ， 你 还 是 可 以 创建 自己 的 异常 。 一 种 情况 是 你 想 在 
特定 的 标准 异常 和 模块 异常 中 添加 额外 的 信息 。 我 们 将 介绍 两 个 例子 ， 都 与 IOError 有 关 。 
IOError 是 一 个 用 于 输入 /输出 地 通用 异常 ， 可 能 在 无 效 的 文件 访问 或 其 他 形式 的 通信 中 触发。 
假如 我 们 想 要 更 加 明确 地 标明 问题 的 来 源 ， 比 如 : 对 于 文件 错误 ， 我 们 希望 有 行为 类 似 
IOError 的 一 个 FileError 异 常 ， 但 是 名 字 表 明 是 在 执行 文件 操作 。 

我 们 将 查看 的 另 一 个 异常 与 套 接 字 (socket) 网 络 编程 有 关 。Ssocket 模 块 生 成 的 异常 叫 


Socket.error， 不 是 内 建 的 异常 。 它 从 通用 Exception 类 派生 。 然 而 socket.error 这 个 异常 的 宗 
由 和 |OError 很 类 似 ， 所 以 我 们 打算 定义 一 个 新 的 从 IOError 派 生 的 NetworkError 的 异常 ， 但 是 


其 包含 了 socket.error 提 供 的 信息 。 
如 同类 和 面向 对 象 编程 ， 我 们 暂时 不 会 正式 介绍 网 络 编程 ， 如 果 你 需要 的 话 可 以 跳 到 16 章 。 


我 们 现在 给 出 一 个 叫做 myexc.py 的 模块 和 我 们 自 定义 的 新 异常 FileError 与 NetworkError. 代 三 
如 例 10.2。 
例 10.2 创建 异常 (myexc.py) 


此 模块 定义 了 两 个 新 的 异常 ，FileError 和 NetworkError， 也 重新 实现 了 一 个 诊断 版 的 
openO[myopen()]fesocket.connect()[myconnect()] > 同时 包含 了 一 个 测试 函数 [test()]， 当 直 
接 运 行文 件 时 执行 。 


1 #1/usr/bin/env python 

2 

3 import os, socket, errno, types, tempfile 
4 

5 class NetworkError(IOError) 

6 pass 

3 

8 class FileError(IOError) 

9 pass 

10 

11 def updArgs (args, newarge*None): 

12 if isinstance(args, IOError): 

13 myargs * [] 

14 myargs.extend([arg for arg ín arcs]) 
15 else: 

16 myargs = list(args) 

17 

18 if newarg: 

19 myarqgqs.append(newarg) 

20 

21 return tuple(myargs) 

22 

23 def fileArgs(file, mode, args): 

24 if args[0] == errno.EACCES and \ 

25 'access' in dir(os) 

26 perms va 

27 permd = ( 'rz': os.R OK, 'w': os.W CK, 
28 'x': 08.X OK) 

29 pkeys = permd.keys() 

30 pkeys.sort () 

31 pkeys.reverse() 

32 

33 for eachPerm in 'rwx': 

34 if os.access(file, permd[eachPerm]): 
35 perms += eachPerm 

36 else: 

37 perms t= '-' 

38 

39 if isinstance(args, IOError): 

40 myargs = [] 


41 myargs.extend([arg for arg in args]! 
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42 
43 
44 
45 
46 
47 
48 
439 
50 
51 
52 
$53 
$4 
55 
56 
51 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
77 
78 
79 
80 
81 
82 
83 
84 
85 
86 
87 
88 
89 
90 


else: 
myargs = list(args) 


myargs[1] = "'$s' 4s (perms: '$s')"& \ 
(mode, myargs[1], peras) 


myarqs.append(args.filename) 


else: 
myargs = args 


return tupleimyargs) 


def myconnect(sock, host, port): 


try: 
sock.connect((host, port)) 


except socket,error, args: 
myargs = updArgs (args) * conv inst2tuple 


if leni(myargs) == 1: 4 no (s on some errs 


myargs = (errno.ENXIO, myargs[0]) 


raise NetworkError, * 


updArgs(myargs, host + ': * + str(port)) 


def myopen(file, mode-'r'): 


try: 
fo = open(file, mode) 
except IOÉrror, args: 
raise FileError, fileArgs(file, mode, args) 


return fo 


def testfilel): 


file = mktempi) 
f = open(fíle, 'w*') 
f.close() 


for eachTest in ((9, 'r'), (0100, 'r"), 
(0400, 'w'), (0500, 'w')): 
try: 
0s.chmod(file, eachTest[0]) 
f = myopen(file, eachTest[1]) 


except FileError, args: 
print "is: $5"* \ 
(args., class, . name , args) 
elso: 
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91 print file, "opened ok... perm ignored" 


97 def testnet(): 
3 sket ( zke \F T 
4 CK EAM 
for eachHost in ('deli', 'www'): 
L try: 
m r ( de 8080) 
except NetworkError, args: 
print " 
106 (args. class . name , args) 
8 if am 1 
1 b 
110 testnet() 
Jo 
1~ 347 


模块 的 开始 部 分 是 Unix 启 动 脚本 和 socket、os、errno、types 和 tempfile 模 块 的 导入 。 
5~9 行 


无 论 你 是 否 相 信 ， 这 5 行 代码 定义 了 我 们 的 新 异常 。 不 是 仅仅 一 个 ， 而 是 两 个 。 除 了 将 要 介绍 
的 一 个 新 功能 ， 创 建 一 个 新 的 异常 仅 需 要 从 一 个 已 经 存在 的 异常 类 派生 一 个 出 子 类 。 本 例 

中 ， 这 个 基 类 是 IOError。 我 们 也 可 以 从 IOError 的 基 类 EnvironmentError 派 生 ， 但 我 们 想 明 确 
表明 我 们 的 异常 是 MO 相关 的 。 


我 们 选择 IOError 是 因为 它 提供 了 两 个 参数 ， 一 个 错误 编号 和 一 个 错误 字符 串 。 文 件 相 关 [ 用 
open()] 的 IOError 异 常 甚至 支持 大 部 分 异常 没有 的 第 三 个 参数 ， 那 个 可 以 是 文件 名 。 我 们 将 对 
这 个 在 主要 元 组 之 外 的 ， 名 字 叫 Hlename” 的 参数 执行 一 些 特定 的 操作 。 

11 ~ 21 行 

updArgs() 函 数 的 全 部 意图 就 是 < 更 新 "异常 的 参数 。 我 们 这 里 的 意思 是 原来 的 异常 提供 给 我 们 
一 个 参数 集 。 我 们 希望 获取 这 些 参 数 并 让 其 成 为 我 们 新 的 异常 的 一 部 分 ， 可 能 是 瞬 入 或 添加 
第 三 个 参数 (如 果 没 有 传 入 ， 什 么 也 不 添加 一 None 是 其 默认 值 ， 我 们 下 一 章 将 会 学 习 ) o 
我 们 的 目标 是 提供 更 多 的 细节 信息 给 用 户 ， 这 样 当 问题 发 生 时 能 够 尽快 的 捕 提 到 。 





23 ~ 53 行 


函数 fleArgs() 仅 在 myopen() 中 使 用 〈 如 下 ) 。 实 际 上 ， 我 们 寻找 表示 "没有 权限 (permission 
denied.) ”的 错误 EACCES。 其 他 所 有 的 IDError 异 常 我 们 将 不 加 修改 (54~5547) 的 传递 。 
如 果 你 对 ENXIO、EACCES 和 其 他 的 系统 错误 号 感到 好 奇 ， 你 可 以 从 Unix 系 统 


"F/usr/include/sys/errno.h 3 Windows & Zi T Visula C++ 的 C: \Msdev\include\Errno.h 文 件 来 对 
ET 6 IR EJ, o 


在 第 27 行 ， 我 们 也 确认 了 我 们 当前 使 用 的 机 器 支持 os.access() 函 数 ， 它 用 来 检查 对 任意 一 个 
特定 文件 你 所 拥有 的 权限 。 除 非 我 们 收 到 权限 错误 同时 也 能 够 检查 我 们 拥有 的 权限 ， 否 则 我 
们 什么 不 做 。 当 一 切 完 毕 ， 我 们 设置 一 个 字典 来 帮助 构建 表示 我 们 对 文件 所 拥有 的 权限 的 字 
符 串 。 


Unix 文 件 系统 清晰 标明 用 户 (user) 、 组 (group， 可 以 有 多 个 用 户 属于 一 个 组 ) 和 其 他 
(other， 不 是 所 有 者 ， 也 不 和 所 有 者 同 组 的 用 户 ) 对 文件 的 读 、 写 、 执 行 CD, w, X) 的 权 
限 。 


Windows 支 持 这 些 权限 中 的 一 部 分 。 现 在 可 以 来 构建 权限 字符 串 了 。 如 果 对 文件 有 某 种 权 
限 ， 字 符 串 中 就 有 相应 的 字母 ， 否 则 用 '-' 替 代 。 比 如 ， 字 符 串 rw-' 标 明 你 可 以 对 其 进行 读 / 写 访 
间 。 如 果 字符 串 是 1-x， 你 仅 可 -以 对 其 进行 读 和 执行 操作 ;“--' 标 示 没有 任何 权限 。 


当权 限 字 符 串 构建 完成 后 ， 我 们 创建 了 一 个 临时 的 参数 列表 。 我 们 随后 更 改 了 错误 字符 串 使 
之 包含 权限 字符 串 。 (标准 的 |OError 异 常 并 没有 提供 权限 字符 囊 相 关 信 息 ) 。”Permission 
denied (没有 权限 ) ”这 个 错误 似乎 很 愚 悉 ， 而 且 系 统 并 没有 提供 纠正 它 的 方法 。 当 然 这 是 出 
于 安全 的 考虑 。 当 入 侵 者 没有 权限 访问 某 个 东西 时 ， 最 好 不 要 让 他 们 看 到 文件 的 权限 。 不 

过 ， 我 们 的 例子 仅仅 是 一 个 练习 ， 所 以 我 们 可 以 暂时 地 ”违背 安全 ”。 问 题 的 关键 在 于 确认 调用 
os.chmod() 有 函数 修改 后 的 文件 权限 是 不 是 你 的 本 意 。 

最 后 一 件 事 情 我 们 把 文件 名 加 入 参数 列表 ， 并 以 元 组 形式 返回 参数 。 

55 ~ 656 

我 们 新 的 myconnect() 函 数 仅 仅 是 简单 的 对 套 接 字 的 函数 conect() 进 行 包 装 当 网 络 连接 失败 时 
提供 一 个 IOError 类 型 的 异常 。 和 一 般 的 socket.error 不 一 样 ， 我 们 还 提供 给 程序 员 主 机 名 和 端 
口号 。 

对 于 刚刚 接触 网 络 编程 的 ， 主 机 名 和 端口 号 可 以 想象 为 当 你 联系 某 人 时 的 区 号 和 电话 号 。 在 
这 个 例子 中 ， 我 们 试 着 去 连接 一 个 在 远程 主机 上 运行 的 程序 ， 可 能 是 某 种 服务 。 因 此 我 们 需 
要 知道 主机 名 和 服务 器 监听 的 端口 。 

当 失 败 发 生 时 ， 错 误 号 和 错误 字符 很 有 帮助 ， 但 是 如 果 结 合 更 精确 的 主机 -端口 会 更 有 帮助 ， 
为 这 一 对 可 能 是 由 某 个 数据 库 或 名 称 服务 动态 生成 或 重新 获得 。 这 些 值 由 我 们 版 本 的 
connect() 加 入 。 另 一 种 情形 是 无 法 找到 主机 ，Ssocket.error 异 常 没有 直接 提供 的 错误 号 ， 我 们 
为 了 遵循 IOError 协 议 ， 提 供 了 一 个 错误 号 -错误 字符 串 对 ， 我 们 查找 最 接近 的 错误 号 。 我 们 选 
F| ENXIO ° 


67 ~ 7341 


类 似 同类 myconnect(), myopen()4531 X T7 €,22 7$ 4e 8 ERA o 3x V. » RAA 3 I open() $ 
数 。 我 们 仅仅 捕捉 IOError 异 常 。 所 有 的 其 他 都 忽略 并 传 给 下 一 层 (因为 没有 与 他 们 相关 的 处 
RE) 。 一 旦 捕 提 到 |OError 我 们 引发 我 们 自己 的 异常 并 通过 fileArgs() 返 回 值 来 定制 参数 。 


75 ~ 95 行 


我 们 首先 测试 文件 ， 这 里 使 用 testfile() 函 数 。 开 始 之 前 ， 我 们 需要 新 建 一 个 测试 文件 ， 以 便 我 
们 可 以 手工 修改 其 权限 来 造成 权限 错误 。 这 个 tempfile 模 块 包含 了 创建 临时 文件 文件 名 和 临时 
文件 的 代码 。 当 前 我 们 仅仅 需要 文件 名 ， 然 后 用 myopen() 函 数 来 创建 一 个 空 的 文件 。 注 意 ， 
如 果 此 次 产生 了 错误 ， 我 们 不 会 捕获 ， 我 们 的 程序 将 致命 的 终止 一 一 测试 程序 当 我 们 连 文件 
都 无 法 创建 时 不 会 继续 。 





我 们 的 测试 用 了 4 种 不 同 的 权限 配置 。 零 表示 没有 任何 权限 ，0100 表 示 仅 能 执行 ，0400 表 示 
只 读 ，0500 表 示 只 可 读 或 执行 (0400+0100) 。 在 所 有 的 情况 下 ， 我 们 试图 用 一 种 无 效 的 方 
式 打开 文件 。os.chmod() 被 用 来 改变 文件 的 权限 (注意 : 这 些 权限 有 前 导 的 零 ， 表 明 他 们 是 
八进制 [基数 8] 数 ) 。 


如 果 发 生 错误 ， 我 们 希望 可 以 显示 诊断 的 信息 ， 类 似 Python 解 释 器 捕获 异常 时 所 做 的 那样 。 
这 就 是 给 出 异常 名 和 紧 跟 其 后 的 异常 的 参数 。 cass “属性 表示 实例 化 该 实例 的 类 对 象 。 比 
在 此 显示 完整 的 类 名 (myexc.FileError) 更 好 的 做 法 是 通过 类 对 象 的 _name 属性 来 显示 类 
名 (FileError) ， 这 也 是 异常 未 被 捕获 时 你 在 解释 器 所 见 到 的 。 随 后 是 我 们 在 封装 函数 中 辛 辛 
苦 苦 聚 到 一 起 的 参数 。 


如 果 文 件 被 打开 成 功 ， 也 就 是 权限 由 于 某 种 原因 被 忽略 。 我 们 通过 诊断 信息 指明 并 关闭 文 
件 。 当 所 有 的 测试 都 完成 时 ， 我 们 对 文件 开启 所 有 的 权限 然后 用 os.unlink() 移 除 
(os.remove() 等 价 于 os.unlink()) 。 


97 ~ 106 行 


下 一 段 代码 (testnet()) 测试 了 我 们 的 网 络 异常 。 套 接 字 是 一 个 用 来 与 其 他 主机 建立 连接 的 通 
言 端 点 。 我 们 创建 一 个 套 接 字 ， 然 后 用 它 连 接 一 个 没有 接受 我 们 连接 的 服务 器 的 主机 和 一 个 
不 存在 于 我 们 网 络 的 主机 。 


108 ~ 110 行 


我 们 希望 仅 在 直接 调用 我 们 脚本 时 执行 test*() 函 数 ， 此 处 的 代码 完成 了 该 功能 。 大 多 数 脚本 用 
同样 的 格式 给 出 了 这 段 文本 。 


在 Unix 系 的 机 器 上 运行 这 段 脚 本 ， 我 们 得 到 了 如 下 的 输出 : 


SmYeXC ,DYy 


FileError: [Errno 13] 'r' Permission denied (perms: ' 


'/usr/tmp/818908.1"' 

FileError: [Errno 13] 'r' Permission denied (perms: '--x'): 
'/usr/tmp/818908.1"' 

FileError: [Errno 13] 'w' Permission denied (perms: 'r--'): 
'/usr/tmp/818908.1"' 

FileError: [Errno 13] 'w' Permission denied (perms: 'r-x'): 
'/usr/tmp/818908.1" 

NetworkError: [Errno 146] Connection refused: 'deli: 8080' 


NetworkError: [Errno 6] host not found: 'www: 8080' 


在 Win32 的 机 器 上 有 些 不 同 : 


D: Mpython» python myexc.py 
C: NWINDOWSNTEMPN-—-195619-1 opened ok... perms ignored 
C: NWINDOWSNTEMPN—-195619-1 opened ok... perms ignored 


FileError: [Errno 13] 'w' Permission denied (perms: 'r-x'): 
'C: NNWINDOWSNNTEMPNN—-195619-1' 

FileError: [Errno 13) 'w' Permission denied (perms: 'r-x'): 
'C: NNWINDOWSNNTEMPNN—-195619-1' 

NetworkError: [Errno 10061] winsock error: 'deli: 8080' 


NetworkError: [Errno 6] host not found: 'www: 8080' 


你 可 以 看 到 Windows 不 支持 文件 的 读 权 限 ， 这 就 是 前 两 次 尝试 文件 打开 成 功 的 原因 。 在 你 的 
机 器 和 操作 系统 上 的 结果 可 能 会 大 相 径 庭 。 


10.10 (现在 ) 为 什么 用 异常 


毫 无 疑问 ， 错 误 的 存在 会 伴随 着 软件 的 存在 。 区 别 在 于 当今 快 节奏 的 计算 世界 ， 我 们 的 执行 
， 所 以 我 们 需要 改变 错误 处 理 ， 以 准确 反映 我 们 软件 的 开发 环境 。 就 现今 应 用 
来 说 ， 普 遍 的 是 自 备 (self-contained) 的 图 形 用 户 界面 (GUI). 或 是 客户 机 /服务 器 体系 ， 例 
RM o 


在 应 用 层 处 理 错误 的 能 力 近来 变 得 更 为 重要 ， 用 户 已 不 再 是 应 用 程序 的 的 唯一 的 直接 运行 
者 。 随 着 互联 网 和 网 上 电子 商业 应 用 越 来 越 普及 ，web 服 务 器 将 成 为 应 用 软件 的 主要 客户 
CO M LN UI d 文 样 ， 系 统 错 误导 致 浏览 器 的 错 
误 ， 这 反 过 来 又 会 让 用 户 沁 品 。 失 去 眼球 意味 着 失去 广告 收入 和 和 潜在 的 大 量 无 可 挽回 的 生 


> 
m? 


ps 


如 果 错 误 的 确 发 生 了 ， 它 们 一 般 都 PEN DL 运行 环境 必须 足够 强健 ， 来 
处 理应 用 级 别 的 错误 ， 并 提供 用 户 级 别 的 错误 信息 。 就 服务 器 而 言 ， 这 必须 转化 为 一 个 “ 非 错 
误 " 因 为 应 用 必须 要 成 功 完 成 ， 即 使 所 做 的 不 过 是 返回 一 个 错误 的 信息 ， 向 用 户 是 提供 一 个 有 


效 的 超 文 本 标记 语言 (HTML) 的 网 页 指明 错误 。 


如 果 你 不 清楚 我 在 说 什么 ， 那 么 一 个 简单 的 网 页 浏览 器 窗口 ， 用 大 而 黑 的 字体 写 到 "内 部 服务 
器 错误 "是 否 更 耳 熟 ? 用 一 个 弹出 式 窗口 宣告 "文件 中 没有 数据 ?的 致命 错误 如 何 ? 作为 一 个 用 
户 ， 这 些 词语 对 你 有 意义 吗 ? 没 有 ， 当 然 没 有 (除非 你 是 一 个 互联 网 软件 工程 师 ) ， 至 于 对 
普通 用 户 来 说 ， 这 些 是 无 休止 的 混乱 和 挫折 感 的 来 源 。 这 些 错 误导 致 在 执行 的 程序 时 的 失 

败 。 应 用 不 论 是 返回 无 效 的 超 文 本 传输 协议 (http) 数据 还 是 致命 地 终止 ， 都 会 导致 Web 服 务 
器 举 手 投 降 ， 说 :“ 我 放弃 1” 


这 种 类 型 的 执行 错误 不 应 该 被 允许 ， 无 论 情况 如 何 。 随 着 系统 变 得 更 加 复杂 ， 又 牵涉 到 更 多 
的 新 手 用 户 ， 要 采取 额外 的 措施 ， 确 保 用 户 平滑 地 学 到 应 用 经 验 。 即 使 面 对 一 个 错误 ， 应 用 
应 该 成 功 的 中 止 ， 不 至 于 灾难 性 的 影响 其 执行 环境 。Python 异 常 处 理 促使 成 就 和 正确 的 纺 


程 。 


10.11 到 底 为 什么 要 异常 


如 果 上 文 的 动机 不 够 充分 ， 试 想 Python 编 程 没有 程序 级 的 异常 处 理 。 第 一 件 事 需要 担心 的 是 
客户 端 程序 员 在 自己 的 代码 中 遗忘 控制 。 举 例 来 说 ， 如 果 你 创造 了 一 个 交互 的 应 用 程序 分 配 
并 使 用 了 大 量 的 资源 ， 如 果 一 个 用 户 击 中 CtrltC 或 其 他 键盘 中 断 ， 应 用 程序 将 不 会 有 机 会 执行 
清理 工作 ， 可 能 导致 数据 丢失 或 数据 损坏 。 此 外 ， 也 没有 机 制 来 给 出 可 选 的 行为 ， 诸 如 提示 
用 户 ， 以 确认 他 们 昌 的 是 想 退 出 或 是 他 们 意外 的 按 下 了 Ctrl 键 。 


另 一 个 缺点 就 是 函数 必须 重 写 来 为 错误 的 情形 返回 一 个 “特殊 "的 值 ， 如 : None。 程 序 员 要 负 
责 检 查 每 一 个 函数 调用 的 返回 值 。 这 可 能 是 个 麻烦 ， 因 为 你 可 能 不 得 不 检查 返回 值 ， 这 和 没 
有 发 生 错 误 时 你 期 待 结 果 也 许 不 是 同一 类 型 的 对 象 。 什 么 ， 你 的 函数 要 把 None 作 为 一 个 有 效 
的 数值 返回 ? 那么 ， 你 将 不 得 不 拿 出 另 一 个 返回 值 ， 也 许 是 负数 。 我 们 也 许 并 不 需要 提醒 
你 ， 在 Python 的 环境 下 负数 下 可 能 是 有 效 的 ， 比 如 作为 一 个 序列 的 索引 。 作 为 一 个 写 应 用 程 
序 接口 (API) 的 程序 员 ， 你 不 得 不 为 每 个 一 个 用 户 输入 可 能 遇 到 的 返回 错误 写 文档 。 同 时 ， 
我 们 难以 (而且 乏 味 ) 在 多 层次 的 代码 中 以 传播 错误 (和 原因 ) 。 


没有 一 个 简单 的 传播 方法 像 异常 一 样 做 到 这 一 点 。 因 为 错误 的 数据 需要 在 调用 层次 中 向 上 转 
发 ， 但 在 前 进 的 道路 上 可 能 被 曲解 。 一 个 不 相干 的 错误 可 能 会 被 宣布 为 起 因 ， 而 实际 上 它 与 
原始 问题 完全 无 关 。 在 一 层 一 层 的 传递 中 ， 我 们 失去 了 对 原始 错误 封装 和 保管 的 能 力 ， 更 不 
用 说 完全 地 失去 我 们 原本 关心 的 数据 的 踪影 ! 异常 不 仅 简化 代码 ， 而 且 简 化 整个 错误 管理 体 
系 一 一 它 不 该 在 应 用 开发 中 如 此 重要 角色 ; 而 有 了 Python 的 异常 处 理 能 力 ， 也 的 确 没有 必要 
了 。 


10.12 弄 常 和 sys 模 块 


另 一 种 获取 异常 信息 的 途径 是 通过 sys 模 块 中 exc_info() 函 数 。 此 功能 提供 了 一 个 3 元 组 (3- 
tuple) 的 信息 ， 多 于 我 们 单纯 用 异常 参数 所 能 获得 。 让 我 们 看 看 如 何 用 sys.exc_info() : 


>>> try: 
float ('abc123') 
except: 
import sys 


exc_tuple = sys.exc_info() 


>>> print exc_tuple 

(<class exceptions.ValueError at f9838>, <exceptions. 
ValueError instance at 122fa8>, 

«traceback object at 10de18») 


>>> 


>>> for eachItem in exc _ tuple: 


print eachItem 


exceptions.ValueError 
invalid literal for float(): abc123 


«traceback object at l0del8» 
我 们 从 sys.exc_info() 得 到 的 元 组 中 是 : 
exc type:t d X ; 
exc value : 异常 类 的 实例 ; 
exc traceback : 跟踪 记录 对 象 。 


我 们 所 熟悉 的 前 两 项 : 实际 的 异常 类 ， 和 这 个 异常 类 的 实例 《和 在 上 一 节 我 们 讨论 的 异常 参 
数 是 一 样 的 ) 。 第 三 项 ， 是 一 个 新 增 的 跟踪 记录 对 象 。 这 一 对 象 提 供 了 的 发 生 弄 常 的 上 下 
文 。 它 包含 诸如 代码 的 执行 帧 ， 红 常 发 生 时 的 行 号 等 信息 。 


在 昌 版 本 中 的 Python 中 ， 这 三 个 值 分 别 存在 于 sys 模 块 ， 为 sys.exc_type、sys.exc_value、 
sys.exc_traceback。 不 幸 的 是 ， 这 三 者 是 全 局 变量 而 不 是 线程 安全 的 。 我 们 建议 亡羊补牢 ， 
用 Sys.exc_info() 来 代替 。 在 未 来 版 本 Python 中 ， 所 有 这 三 个 变量 都 将 被 逐步 停 用 ， 并 最 终 移 
除 。 


10.13 ”相关 模块 


表 10.3 是 本 章 的 相关 模块 。 


o ox 
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表 10.3 异常 相关 的 标准 库 
"n x "ES 
exceptions Wi ERUKIACSHO DA Lc OUR) 
contextlib" 为 使 用 with 语句 的 上 下 文 对 象 工具 
sys tí de RERO GRRE C, sys.ex*) 
a. Python2.5 om. 


10.14 练习 
10-1. 引 发 异常 。 以 下 的 哪个 因素 会 在 程序 执行 时 引发 异常 ? 注意 这 里 我 们 问 的 并 不 是 异 
常 的 原因 。 
a) 用 户 ; 
b) 解 释 器 ; 
C) 程 序 ; 
d) 以 上 所 有 ; 
e) 只 有 b) fec) ; 
AR Aa) fec)» 
10-2. 引 发 异常 。 参 考 上 边 问题 的 列表 ， 哪 些 因素 会 在 执行 交互 解释 器 时 引发 异常 ? 
10-3. 关 键 字 。 用 来 引发 异常 的 关键 字 有 哪些 ? 
10-4. 关 键 字 。try-except 和 try-finally 有 什么 不 同 ? 
10-5. 异 常 。 下 面 这 些 交 互 解释 器 下 的 Python 代码 段 分 别 会 引发 什么 异常 (参阅 表 10.2 给 
出 的 内 建 异 常 清单 ) 


{a) >>> if 3 < 4 then: print '3 IS less than 4!' 
(b) >>> aList = ['Hello', 'World!', "'Anyone', 
'Home? '] 

>>> print 'the last string in aList is: ', aList 

[len(aList)] 

(c) >>> x 
(d) 55» x-27450 
(e) >>> import math 

>>> i = math.sqrt (-1) 
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10-6. 改 进 的 open()。 为 内 建 的 open() 有 函数 创建 一 个 封装 。 使 得 成 功 打开 文件 后 ， 返 回 文 
件 句 柄 ; 若 打开 失败 则 返回 给 调用 者 None， 而 不 是 生成 一 个 异常 。 这 样 你 打开 文件 时 就 
不 需要 额外 的 异常 处 理 语句 。 


10-7. 异 常 。 下 面 两 段 Python 伪 代码 a) 和 b) 有 什么 区 别 ? 考虑 语句 A 和 B 的 上 下 文 环 
境 。 (这 么 细致 的 区 别 要 感谢 Guido ! ) 
(a) try: 
statement A 


except ...: 


else: 


statement B 


(b) try: 
statement A 
statement B 


except...: 


10-8. 改 进 的 raw_input()。 本 章 的 开头 ， 我 们 给 出 了 一 个 “安全 ”的 float() 函 数 ， 它 建立 在 内 
建 函 数 float() 上 ， 可 以 检测 并 处 理 float() 可 能 会 引发 的 两 种 不 同 异 常 。 同 样 ，raw_input() 
函数 也 可 能 会 生成 两 种 异常 ，EOFError (文件 末尾 EOF， 在 Unix 下 是 由 于 按 下 了 Ctrl+D 
在 Dos 下 是 因为 Ctrl+Z) 或 是 Keyboardlnterrupt (取消 输入 ， 一 般 是 由 于 按 下 了 

Ctrl-C) 。 请 创建 一 个 封装 函数 safe_input()， 在 发 生 措 常 时 返回 None。 


10-9. 改 进 的 math.sqrt()。math 模 块 包含 大 量 用 于 处 理 数 值 相关 运算 的 函数 和 常量 。 不 幸 
的 是 ， 它 不 能 识别 复数 ， 所 以 我 们 创建 了 cmath 模 块 来 支持 复数 相关 运算 。 请 创建 一 个 
safe_sqrt() 函 数 ， 它 封装 math.sqrt() 并 能 处 理 负 值 ， 返 回 一 个 对 应 的 复数 。 
[1 人. 从 Python1.5 开 始 ， 所 有 的 标准 异常 都 使 用 类 来 实现 。 如 果 你 对 类 、 实 例 和 其 他 面向 对 象 相 
关 术 语 不 太 了 解 ， 请 参阅 第 13 章 。 
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$11 Aife XAR 


e 创建 函数 
€ 条 件 表 达 式 


€ 变 长 参数 

e 函数 式 编程 
e 变量 的 作用 域 
4 递归 

e 生成 器 


在 第 2 章 ， 我 们 引入 了 函数 ， 并 介绍 了 函数 的 创建 和 调用 。 这 一 章 ， 我 们 将 在 前 面 内 容 的 基础 
上 ， 详 细 的 讲解 函数 的 方方面面 。 除 了 预期 特性 之 外 ，Python 中 的 函数 还 支持 多 种 调用 方式 
以 及 参数 类 型 并 实现 了 一 些 函 数 式 编程 接口 。 最 后 我 们 将 以 对 Python 变量 的 作用 域 和 递归 函 
数 的 讨论 来 结束 本 章 的 学 习 。 


11.1 件 么 站 函数 ? 


函数 是 对 程序 逻辑 进行 结构 化 或 过 程 化 的 一 种 编程 方法 。 能 将 整 块 代码 巧妙 地 隔离 成 易于 管 
理 的 小 块 ， 把 重复 代码 放 到 函数 中 而 不 是 进行 大 量 的 拷贝 一 -这样 既 能 节省 空间 ， 也 有 助 于 
保持 一 致 性 ， 因 为 你 只 需 改变 单个 的 拷贝 而 无 须 去 寻找 再 修改 大 量 复 制 代码 的 拷贝 。Python 
中 函数 的 基础 部 分 与 你 熟悉 的 其 他 的 语言 没有 什么 不 同 。 本 章 开 始 ， 我 们 先 回顾 一 下 函数 基 
础 ， 然 后 将 着 重 介绍 Python 函数 的 其 他 特性 。 


函数 可 以 以 不 同 的 形式 出 现 。 下 面 简单 展示 了 一 些 创建 、 使 用 ， 或 者 引用 函数 的 方法 。 


declaration/definition def foo(): print 'bar 
function object/reference foo 


function call/invocation foo() 


11.1.1 HAVS 

我 们 经 常 拿 函 数 和 过 程 比 较 。 两 者 都 是 可 以 被 调用 的 实体 ， 但 是 传统 意义 上 的 函数 或 者 " 黑 
人 其 中 一 些 函 数 则 
是 布尔 类 型 的 ， 返 回 一 个 “是 "或 者 “ 否 " 的 回答 ， 更 确切 地 说 ， 一 个 非 零 或 者 零 值 。 而 过 程 是 简 
单 、 特 殊 、 没 有 返回 值 的 函数 。 从 后 面 内 容 你 会 看 到 ，python 的 过 程 就 是 函数 ， 因 为 解释 器 
会 隐 式 地 返回 默认 值 None 。 


11.1.2 返回 值 与 函数 类 型 


函数 会 向 调用 者 返回 一 个 值 ， 而 实际 编程 中 大 部 分 偏 函 数 更 接近 过 程 ， 不 显示 地 返回 任何 东 
西 。 把 过 程 看 待 成 函数 的 语言 通常 对 于 “什么 都 不 返回 "的 函数 1 Ma Nu au 
字 。 这 些 函 数 在 C 中 默认 为 “Void” 的 返回 类 型 ， 意 思 是 没有 值 运 回 。 在 python 中 ， 对 应 的 返 
对 象 类 型 是 none。 


下 面 hello() 函 数 的 行为 就 像 一 个 过 程 ， 没 有 返回 值 。 如 果 保 存 了 返回 值 ， 该 值 为 None: 


>>> def hello(): 

P dis print 'hello world 

222 

>>> res = hello() 

hello world 

>>> res 

>>> print res 

None 

>>> type(res) 

«type 'None'» 
Ab: SRBA £33 0388 — * Python € $4 ECT LR I — A44 SUA A o RA RESI 
个 容器 对 象 的 时 候 有 点 不 同 ， 看 起 来 像 是 能 返回 多 个 对 象 。 好 比 说 ， 你 不 能 拿 着 大 量 零散 的 


商品 离开 百货 店 ， 但 是 你 可 以 将 它们 放 在 一 个 购物 袋 里 ， 然 后 带 着 这 个 袋子 从 商店 走出 去 ， 
合理 合法 。 


def foo(): 
return ['xyz', 1000000, -98.6] 
def bar(): 
return 'abc', [42, 'python'], "Guido" 


foo() £i 43x I — 4-9] & » bar() idi GR EL — 46/8 » d Too E ERE € — xd EAS ， 
Pf VE AG, 9] VA Z8 9D VAR I $ AA o de R AUI] es 2i 328 3X 4 7G 28m E48 3. > bar() 89 XE 36 
看 起 来 会 是 这 样 : 
def bar(): 
return ('abc', [4-2j, 'python'], "Guido") 


从 返回 值 的 角度 来 考虑 ， 可 以 通过 很 多 方式 来 存储 元 组 。 接 下 来 的 3 种 保存 返回 值 的 方式 是 等 
价 的 : 


>>> aTuple = bar() 

>>> x, y, Z = bar() 

»»» (a, b, c) = bar() 

>>> 

>>> aTuple 

('abc', [4-237 , 'python'], 'Guido') 

>>> X. V. Z 

('abc', [(4-2j3) , 'python'], 'Guido') 

>>> 06. m, ©) 

('*abc', [(4-23), 'python'], 'Guido') 
在 对 X、y、Z 和 a、b、c 的 赋值 中 ， 根 据 值 返回 的 顺序 ， 每 个 变量 会 接收 到 与 之 对 应 的 返回 


值 。 而 aTuple 直 接 获 得 函数 隐 式 返回 的 整个 元 组 。 回 想 一 下 ， 元 组 既 可 以 被 分 解 成 为 单独 的 
变量 ， 也 可 以 直接 用 单一 变量 对 其 进行 引用 (参见 6.18.3 小 节 ) 。 


简 而 言 之 ， 当 没有 显 式 地 返回 元 素 或 者 如 果 返 回 None 时 ，Python 会 返回 一 个 None。 那 么 调用 
者 接收 的 就 是 Python 返回 的 那个 对 象 ， 且 对 象 的 类 型 仍然 相同 。 如 果 函 数 返回 多 个 对 象 ， 
Python 把 他 们 聚集 起 来 并 以 一 个 元 组 返回 。 是 的 ， 尽 管 我 们 声称 Python 比 诸如 C 那 样 只 允许 
一 个 返回 值 的 语言 灵活 得 多 ， 但 是 老实 说 ，Python 也 遵循 了 相同 的 传统 ， 只 是 让 程序 员 误 以 
为 可 以 返回 多 个 对 象 。 


返回 的 对 象 的 数 晶 | Python WERE [304] 4 $ 
t 


0 Nonce 
I object 
I tuple 


表 11.1 总 结 了 从 一 个 函数 中 返回 的 对 象 的 数目 ， 以 及 Python 实际 返回 的 对 象 。 





许多 静态 类 型 的 语言 主张 一 个 函数 的 类 型 就 是 其 返回 值 的 类 型 。 在 Python 中 ， 由 于 Python 是 
动态 地 确定 类 型 而 且 函 数 能 返回 不 同类 型 的 值 ， 所 以 没有 进行 直接 的 类 型 关联 。 因 为 重 载 并 
不 是 语言 特性 ， 程 序 员 需 要 使 用 type() 这 个 内 建 函 数 作为 代理 ， 来 处 理 有 着 不 同 参数 类 型 的 函 
数 的 多 重 声明 以 模拟 类 C 语 言 的 函数 重 载 (以 参数 不 同 选择 函数 的 多 个 原型 ) o 


11.2 调用 函数 


11.2.1 部 数 操作 符 


同 大 多 数 语 言 相 同 ， 我 们 用 一 对 贺 括 号 调用 函数 。 实 际 上 ， 有 些 人 认为 (()) 是 一 个 双 字 符 操 
作 符 。 正 如 你 可 能 意识 到 的 ， 任 何 输入 的 参数 都 必须 放置 在 括号 中 。 作 为 函数 声明 的 一 部 
分 ， 括 号 也 会 用 来 定义 那些 参数 。 虽 然 我 们 没有 正式 地 学 习 类 和 面向 对 象 编程 ， 但 你 将 会 发 
现在 Python 中 ， 函 数 的 操作 符 同 样 用 于 类 的 实例 化 。 


11.2.2 ”关键 字 参 数 


数 调 用 中 的 参数 名 字 来 


关键 字 参 数 的 概念 仅仅 针对 函数 的 调用 。 这 种 理念 是 让 调用 者 通过 函 
能 通过 给 出 的 关键 字 来 匹配 参 


区 分 参数 。 这 样 规 范 允 许 参数 缺失 或 者 不 按 顺序 ， 因 为 解释 器 
数 的 值 。 


举 个 简单 的 例子 ， 比 如 有 一 个 函数 foo()， 伪 代码 如 下 : 


def foo(x): 


foo suite # presumably does some processing with 'x' 


标准 调用 foo): foo (42) foo('bar') foo(y) 


关键 字 调 用 foo(: foo (x=42) foo(xs'bar') foo (x=y) 
再 举 个 更 实际 的 例子 ， 假 设 你 有 一 个 函数 叫做 net_conn()， 需 要 两 个 参数 host 和 port : 
def net conn(host, port): 
net conn suite 


只 要 按照 函数 声明 中 参数 定义 的 顺序 ， 输 入 恰当 的 参数 ， 自 然 就 可 以 调用 这 个 函数 : 


net conn('kappa', 8080) 


host Zx 41-5] 3-41 ** 'kappa' * port ZCAF £1 3&78080 . 当然 也 可 以 不 按照 函数 声明 中 的 参数 
顺序 输入 ， 但 是 要 输入 相应 的 参数 名 ， 如 下 例 : 


net conn(port-8080, host-2'chino') 


当 参 数 允许 “缺失 ”的 时 候 ， 也 可 以 使 用 关键 字 参 数 。 这 取决 于 函数 的 默认 参数 ， 我 们 将 在 下 一 
小 节 对 它 进行 介绍 。 


11.2.3 ”默认 参数 


默认 参数 就 是 声明 了 默认 值 的 参数 。 因 为 给 参数 赋予 了 默认 值 ， 所以， 在 函数 调用 时 ， 不 向 
该 参数 传 入 值 也 是 允许 的 。 我 们 将 在 11.5.2 小 节 对 默认 参数 进行 更 全 面 的 介绍 。 


11.2.4 参数 组 

Python 同 样 允许 程序 员 执 行 一 个 没有 显 式 定义 参数 的 函数 ， 相 应 的 方法 是 通过 一 个 把 元 组 
( 非 关键 字 参数 ) 或 字典 (关键 字 参 数 ) 作为 参数 组 传递 给 函数 。 我 们 将 在 本 章 中 讨论 这 两 
种 形式 。 基 本 上 ， 你 可 以 将 所 有 参数 放 进 一 个 元 组 或 者 字典 中 ， 仅 仅 用 这 些 装 有 参数 的 容器 
来 调用 一 个 函数 ， 而 不 必 显 式 地 将 它们 放 在 函数 调用 中 : 


func(*tuple grp nonkw args, **dict grp kw args) 


其 中 的 tuple_ grp nonkw. args 是 以 元 组 形式 体现 的 非 关 键 字 参 数组 ，dict grp. kw. argszt € 
有 关键 字 参 数 的 字典 。 正 如 我 们 已 经 提 到 的 ， 我 们 将 在 这 章 对 这 两 者 进行 全 面 介 绍 ， 现 在 你 
只 需 知 道 ， 存 在 这 样 的 特性 允许 你 把 变量 放 在 元 组 和 /或 者 字典 里 ， 并 在 没有 显 式 地 对 参数 进 
行 逐 个 声明 的 情况 下 ， 调 用 函数 。 

实际 上 ， 你 也 可 以 给 出 形 参 ! 这 些 参数 包括 标准 的 位 置 参 数 和 关键 字 参 数 ， 所 以 在 Python 中 
允许 的 函数 调用 的 完整 语法 为 : 


func(positional args, keyword args, 
*tuple grp nonkw args, **dict grp kw args) 
该 语法 中 的 所 有 的 参数 都 是 可 选 的 一 -从 参数 传递 到 函数 的 过 程 来 看 ， 在 单独 的 函数 调用 


时 ， 每 个 参数 都 是 独立 的 。 这 可 以 有 效 地 取代 apply() 内 建 函 数 。【〈 在 Python 1.6 版 本 之 前 ， 这 
样 的 参数 对 象 只 能 通过 apply() 函 数 来 调用 ) 。 


1. 例 子 


在 子 11.1 里 的 数学 游戏 中 ， 我 们 用 函数 调用 转换 来 生成 一 个 有 两 个 子 项 的 参数 列表 ， 并 把 这 个 
列表 发 送 给 合 的 适 算术 函数 (我 们 也 会 指出 在 原来 版 本 中 哪些 地 方 会 用 到 apply()) 。 


easyMath.py 程 序 是 一 个 儿童 算术 游戏 ， 可 以 随机 选择 算术 加 减法 。 我 们 通过 有 函数 add()， 
sub() 等 价 +- 操 作 符 ， 这 两 者 都 可 以 在 operator 模 块 中 找到 。 接 着 我 们 生成 一 个 参数 列表 (该 列 
表 只 有 2 个 参数 ， 因 为 这 些 是 二 元 操作 符 / 运 算 ) 。 接 着 选择 任意 的 数字 作为 莫 子 。 因 为 我 们 没 
打算 在 这 个 程序 的 基础 版 本 中 支持 负数 ， 所 以 我 们 将 两 个 数字 的 列表 按 从 大 到 小 的 顺序 排 

序 ， 然 后 用 这 个 参数 列表 和 随机 选择 的 算术 操作 符 去 调用 相对 应 的 函数 ， 最 后 获得 问题 的 正 
确 解 答 。 


随机 选择 数字 以 及 一 个 算术 函数 ， 显 示 问 题 ， 以 及 验证 结果 。 在 3 次 错误 的 尝试 以 后 给 出 结 
果 ， 等 到 用 户 输入 一 个 正确 的 答案 后 便 会 继续 运行 。 


例 11.1 算术 游戏 (easyMath.py) 


o ox 
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&'/usr/bin/env python 


from operator import add, sub 
from random import randint, choice 


ops = ('*': add, '-': sub] 
MAXTRIES = 2 


def doprob(): 
op = choice('*-') 
nums = [randint(1,10) for i in range(2)] 
nums.sort(reverse-True) 
ans-*ops [op] (*nums) 
pr-'$d $s $d-'$(nums[0],op,nums[1]) 
oops=0 
while True: 
try: 
if int(raw input(pr)) == ans: 
print 'correct' 
break 
if oops--7MAXTRIES: 


print 'answerMn$ss$d'$ (pr, ans) 


else: 


print 'incorrect... try again' 


oops += 1 
except (KeyboardInterrupt, \ 
EOFError, ValueError) : 


print 'invalid input... try again' 


def main (): 
while True: 
doprob() 


try: 


opt = raw input('Again? [y]').lower() 


if opt and opt[0] == 'n': 
break 


except (KeyboardInterrupt, EOFError): 


break 


if name "Man 


main() 
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1-4 


我 们 的 代码 从 通常 的 unix 启 动 行 开始 ， 接 着 从 operator 和 random 模 块 中 ， 导 入 我 们 会 用 到 的 
BK e 


6-75 

在 这 个 应 用 程序 中 我 们 用 的 全 局 变量 有 : 一 个 包含 了 操作 符 和 与 其 相关 联 的 函数 的 集合 ( 字 
R) ， 一 个 决定 在 给 出 正解 之 前 ， 用 户 有 多 少 次 机 会 尝试 给 出 答案 的 整 弄 变量。 函数 字典 的 
键 值 是 操作 符 的 符号 ， 程 序 通过 查 字 典 找到 合适 的 算术 函数 。 

9 ~ 28 行 

doprob() 函 数 是 应 用 程序 的 核心 引擎 。 该 函数 随机 选择 一 个 操作 并 生成 两 个 操作 数 ， 同 时 为 了 
避免 减法 问题 中 的 负数 问题 ， 将 这 两 个 算 子 按 大 到 下 进行 排序 。 然 后 用 这 些 值 调用 一 个 数学 


函数 ， 计 算出 正确 的 解 。 接 着 用 一 个 等 式 来 提示 用 户 输 入 并 给 用 户 3 次 机 会 来 输入 一 个 正确 的 


第 10 行 用 了 random.choice() 函 数 。 它 用 于 获取 一 个 序列 一 我们 案例 中 操作 符号 的 字符 串 
一 一 并 随机 返回 其 中 的 元 素 。 

第 11 行 用 了 一 个 列表 解析 来 随机 地 给 我 们 的 练习 选择 两 个 数 。 这 个 例子 非常 的 简单 以 至 于 我 
们 可 以 仅仅 用 两 次 randint() 来 获得 我 们 的 操作 数 ， 比 如 ，nums= 

[randint (1,10) ,randint (1,10) ]， 但 是 为 了 让 你 能 看 看 列表 解析 的 又 一 个 例子 ， 我 们 没有 这 
样 做 ， 而 且 使 用 列表 解析 更 易于 扩展 和 升级 ， 比 如 获得 更 多 的 数 ， 这 与 我 们 使 用 循环 来 代替 
剪 切 和 粘贴 的 原因 相似 。 


第 12 行 只 能 在 Python2.4 以 及 更 新 的 版 本 中 运行 ， 因 为 list.sort() 方 法 原本 不 支持 倒转 的 标志 
位 。 如 果 你 使 用 的 是 更 早 一 点 的 Python 版 本 ， 你 可 以 : 


e. 增加 一 个 反 序 的 比较 函数 来 获得 倒转 的 排序 ， 如 


lambda x, y: cmp(í(y, x)» or 


e AX dt 4 nums.sort()/6 33 f] nums.reverse() 


如 果 你 之 前 没有 看 见 过 lambda， 不 用 害怕 。 我 们 会 在 这 章 对 lambda 进 行 详 述 ， 而 现在 ， 你 可 
以 认为 它 是 一 个 单行 的 匿名 部 数 。 


如 果 你 正 使 用 1.6 以 前 的 python， 那 第 13 行 是 可 能 会 用 到 apply()。 对 合适 运算 函数 的 调用 要 这 
样 写 apply (ops[op], nums) ， 而 不 是 ops[op] (*nums) e° 


16 一 28 行 描述 了 用 来 处 理 有 效 和 无 效 输 入 的 控制 循环 。WwWhile 循 环 是 无 限 循环 ， 直 到 有 正确 答 
案 输 入 或 者 允许 尝试 的 次 数 (我 们 的 程序 中 设 定 为 3 次 ) 被 耗 尽 才 终止 运行 。 这 允许 程序 接受 
不 合法 的 输入 ， 比 如 非 数 字 或 者 各 种 键盘 的 控制 字符 。 一 旦 用 户 超过 了 尝试 最 大 的 次 数 ， 程 
序 就 会 给 出 答案 并 “强制 "用 户 给 出 正确 的 答案 ， 只 有 给 出 答案 ， 程 序 才 会 向 下 进行 。 


30 ~ 41 行 


程序 的 主 入 口 是 main()， 如 果 直 接 运 行 脚本 ， 程 序 将 自 项 向 下 的 运行 。 如 果 被 作为 模块 导入 ， 
导入 者 要 么 调用 doprob() 函 数 来 开始 执行 ， 要 么 调用 main() 来 进入 程序 控制 。main() 简 单 地 调 
用 doprob() 使 用 户 与 脚本 的 主要 功能 进行 交互 ， 并 负责 提示 用 户 退 出 或 者 尝试 下 一 个 问题 。 


因为 数值 和 操作 符 都 是 随机 选择 的 ， 每 次 运行 easyMath.py 的 结果 应 该 都 是 不 一 样 的 。 这 是 我 
们 今天 的 得 到 的 〈 噢 ， 你 的 答案 也 可 能 不 一 样 ) 
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$ easyMath.py 
7-225 
correct 


Again? [y] 


7* 62 42 

correct 

Again? [y] 

t w 3 - 20 
incorrect... try again 
7* 3 m22 
incorrect... try again 
了 * 3-23 

sorry... the answer is 
T * 3x» 

T? "dw 2 

correct 

Again? [y] 

775-23 

correct 


Again? [y] n 


11.3 8l Až 


11.3.1 defié 4j 


函数 是 用 def 语 名 来 创建 的 ， 语 法 如 下 : 


xe 


dfe V CARE 411 


Ys 
Ys 
ybie 


A 立 - 
d$ 113* 


def function name(arguments): 
"function documentation string" 


function body suite 


标题 行 由 def 关 键 字 ， 函 数 的 名 字 ， 以 及 参数 的 集合 《如 果 有 的 话 ) AA -def T 6) 8 URS 
包括 了 一 个 虽然 可 选 但 是 强烈 推荐 的 文档 字 串 和 必需 的 函数 体 。 在 本 书 中 我 们 已 经 看 到 很 多 
函数 的 声明 ， 这 又 是 一 个 : 


def helloSomeone (who): 
'returns a salutory string customized with the input' 


return "Hello " + str(who) 


11.3.2 声明 与 定义 比较 
在 某 些 编程 语言 里 ， 郊 数 声明 和 函数 定义 区 分 开 的 。 一 个 函数 声明 包括 提供 对 函数 名 ， 参 数 


的 名 字 (传统 上 还 UO ik ， 但 不 必 给 出 函数 的 任何 代码 ， 具 体 的 代码 通常 属于 函数 
定义 的 范畴 。 


在 声明 和 定义 有 区 别 的 语言 中 ， 往 往 是 因为 函数 的 定义 可 能 和 其 声明 放 在 不 同 的 文件 中 。 
Python 将 这 两 者 视 为 一 体 ， 函 数 的 子 多 由 声明 的 标题 行 以 及 随后 的 定义 体 组 成 的 。 


11.3.3 ”前 向 引用 


和 其 他 高 级 语言 类 似 ，Python 也 不 允许 在 函数 未 声明 之 前 ， 对 其 进行 引用 或 者 调用 。 我 们 下 
面 给 出 几 个 例子 来 看 一 下 : 


def foo() 
print lin foo()' 


bar () 


如 果 我 们 调用 函数 foo(), 肯 定 会 失败 ， 因 为 函数 bar() 还 没有 声明 : 
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>>> foo() 

in foo() 

Traceback (innermost last): 
File "«stdin»", line 1, in ? 
File "«stdin»", line 3, in foo 


NameError: bar 


我 们 现在 定义 函数 bar()， 在 函数 foo() 前 给 出 bar() 的 声明 : 


def bar(): 


print "in bar(Q' 


def foo(): 
print 'in foo()" 
bar () 
现在 我 们 可 以 安全 的 调用 foo(), 而 不 会 出 现任 何 问题 : 
»»» foo() 


in Liool) 


in bar() 


事实 上 ， 我 们 甚至 可 以 在 函数 bar() 前 定义 函数 foo() : 


def foo(): 
print 'in foo() 
bar () 

def bar(): 


print "in bar()" 


太 神 奇 了 ， 这 段 代码 可 以 非常 好 的 运行 ， 不 会 有 前 向 引用 的 问题 : 


>>> r501) 
in IO00l] 


in bar() 


这 段 代码 是 正确 的 ， 因 为 即使 (在 foo() 中 ) 对 bar() 进 行 的 调用 出 现在 bar() 的 定义 之 前 ， 但 
foo() 本 身 不 是 在 bar() 声 明之 前 被 调用 的 。 换 和 句 话说 ， 我 们 声明 foo()， 然 后 再 声明 bar()， 接 着 
调用 foo()， 但 是 到 那 时 ，bar() 已 经 存在 了 ， 所 以 调用 成 功 。 


注意 foo() 在 没有 错误 的 情况 下 成 功 输 出 了 foo()。 名 字 错 误 是 当 访问 没有 初始 化 的 标识 符 时 才 
产生 的 异常 。 
11.3.4 函数 属性 


在 这 一 章 中 ， 我 们 稍 后 将 对 命名 空间 进行 简短 的 讨论 ， 尤 其 是 它们 与 变量 作用 域 的 关系 。 在 
下 一 章 中 会 有 对 命名 空间 的 更 深入 的 探讨 ， 然 而 ， 这 里 我 们 只 是 想 要 指出 Python 名 称 空间 的 
基本 特征 。 


你 可 以 获得 每 个 Pyhon 模 块 、 类 和 函数 中 任意 的 名 称 空间 。 你 可 以 在 模块 rpo 和 bar 里 都 有 名 为 
X 的 一 个 变量 ， 但 是 在 将 这 两 个 模块 导入 你 的 程序 后 ， 仍 然 可 以 使 用 这 两 个 变量 。 所 以 ， 即 使 
在 两 个 模块 中 使 用 了 相同 的 变量 名 字 ， 这 也 是 安全 的 ， 因 为 句点 属性 标识 对 于 两 个 模块 意味 
了 不 同 的 命名 空间 ， 比 如 说 ， 在 这 段 代码 中 没有 名 字 冲 突 : 


import foo, bar 
print Ioo.x t bart.x 


hA HX Python A ?b— 4 FH] 3 6] E EIRA MA S E A R (更 多 关于 名 称 空间 
将 在 本 章 的 稍 后 部 分 以 及 第 十 二 章 关于 Python 的 模块 中 进行 讨论 ) 。 


def foo(): 

'foo() -- properly created doc string' 
def bar(): 

pass 
bar. doc = 'Oops, forgot the doc str above' 
bar.version = 0.1 


上 面 的 foo() 中 ， 我 们 以 常规 的 方式 创建 了 我 们 的 文档 字 囊 ， 比 如 ， 在 函数 声明 后 第 一 个 没有 
赋值 的 字 串 。 当 声明 bar() 时 ， 我 们 什么 都 没 做 ， 仅 用 了 句点 属性 标识 来 增加 文档 字 串 以 及 其 
他 属性 。 我 们 可 以 接着 任意 地 访问 属性 。 下 面 是 一 个 使 用 了 交互 解释 器 的 例子 〈 你 可 能 已 经 
发 现 ， 用 内 建 函 数 help() 显 示 会 比 用 _doc 属性 更 漂亮 ， 但 是 你 可 以 选择 你 喜欢 的 方式 ) 。 

>>> help(foo) 

Help on function foo in module )main : 

foo() 

foo() -- properly created doc string 

>>> print bar.version 

0.1 

>>> print foo. doc. 

foo() -- properly created doc string 

22» print bar. doc. 


Oops, forgot the doc str above 


注意 我 们 是 如 何在 函数 声明 外 定义 一 个 文档 字 串 。 然 而 我 们 仍然 可 以 就 像 平常 一 样 ， 在 运行 

时 刻 访问 它 。 然 而 你 不 能 在 函数 的 声明 中 访问 属性 。 换 句 话 说 ， 在 函数 声明 中 没有 “self' 这 样 
的 东西 让 你 可 以 进行 诸如 ”dict ['version’] = 0.1 的 赋值 。 这 是 因为 函数 体 还 没有 被 创建 ， 但 
之 后 你 有 了 函数 对 象 ， 就 可 以 按 我 们 在 上 面 描述 的 那样 方法 来 访问 它 的 字典 。 另 外 一 个 自由 

的 名 称 空间 | 


函数 属性 是 在 2.1 中 添加 到 Python 中 的 ， 你 可 以 在 PEP232 中 阅读 到 更 多 相关 信息 。 


11.3.5 AHR AR AA 


在 函数 体内 创建 另外 一 个 函数 (对象 ) ELA GIA o RRRA AAA AE RC AAL 
E Python ZHR & Jd ER (在 2.1 中 引入 但 是 到 2.2 时 才 是 标准 ) ， 内 部 函数 实际 上 很 有 用 
的 。 内 嵌 函 数 对 于 较 老 的 python 版 本 没有 什么 意义 ， 那 些 版 本 中 只 支持 全 局 和 一 个 局 部 域 。 
那么 如 何 去 创 造 一 个 内 巾 函 数 呢 ? 


最 明显 的 创造 内 部 函数 的 方法 是 在 外 部 函数 的 定义 体内 定义 函数 (用 def 关 键 字 ) ， 如 : 
def foo(): 
def bar(): 
print 'bar() called' 
print 'foo() called' 
bar () 
foo() 


bar () 
我 们 将 以 上 代码 置 入 一 个 模块 中 ， 如 innerpy， 然 后 运行 ， 会 得 到 如 下 输出 : 


foo() called 
bar() called 
Traceback (most recent call last): 
File "inner.py", line 11, in ? 
bar() 


NameError: name 'bar' is not defined 


内 部 函数 一 个 有 趣 的 方面 在 于 整个 函数 体 都 在 外 部 函数 的 作用 域 ( 即 是 你 可 以 访问 一 个 对 象 
HEA: 稍 后 会 有 更 多 关于 作用 城 的 介绍 ) 之 内 。 如 果 没 有 任何 对 bar() 的 外 部 引用 ， d 
了 在 函数 体内 ， 任 何 地 方 都 不 能 对 其 进行 调用 ， 这 就 是 在 上 述 代码 执行 到 最 后 你 看 到 异常 
原因 。 


另外 一 个 函数 体内 创建 函数 对 象 的 方式 是 使 用 ambda 语 句 。 我 们 会 在 稍 后 的 11.7.1 小 节 进 行 
讲述 。 如 果 内 部 函数 的 定义 包含 了 在 外 部 函数 里 定义 的 对 象 的 引用 (这 个 对 得 甚至 可 以 是 在 
外 部 函数 之 外 ) ， 内 部 函数 会 变 成 被 称 为 闭 包 (closure) 的 特别 之 物 。 在 接 下 来 的 11.8.4 小 
节 ， 我 们 将 对 闭 包 进行 更 多 的 学 习 。 稍 后 我 们 将 介绍 装饰 器 ， 但 是 例子 程序 也 包含 了 闭 包 的 


11.3.6 “函数 〈 与 方法 ) 装饰 器 


器 背后 的 主要 动机 源 自 Python 面向 对 象 编 程 。 装 饰 器 是 在 函数 调用 之 上 的 修饰 。 这 些 修 
饰 仅 是 当 声 明 一 个 函数 或 者 方法 的 时 候 ， 才 会 应 用 的 额外 调用 。 
装饰 器 的 语法 以 @ 开 头 ， 接 着 是 装饰 器 


函数 的 名 dn 可 an 参数 。 紧 跟着 装饰 器 声明 的 是 被 
P PS E^. 


修饰 的 函数 和 装饰 函数 的 可 选 参数 。 装 饰 器 


QGdecorator(dec opt args) 


def func2Bdecorated(func opt args): 


装饰 器 语法 如 何 (以 及 为 什么 ) 产生 的 呢 ? 装饰 器 背 灵感 是 什么 ?了 唔 ， 当 静态 方法 
ord Python 中 的 时 候 ， 、 : 


class MyClass (object): 
def staticFoo(): 


sStaticFoo = staticmethod(staticFoo) 


(要 澄清 的 是 对 于 那个 发 行 版 本 ， 这 不 是 最 终 的 语法 ) 在 这 个 类 的 声明 中 ， 我 们 定义 了 叫 
staticFoo() 的 方法 。 现 在 因为 打算 让 它 成 为 静态 方法 ， 我 们 省 去 它 的 self 参 数 ， 而 你 a 
中 看 到 ，self 参 数 在 标准 的 类 方法 中 是 必需 的 。 接 着 用 staticmethod() 内 建 函 数 来 将 这 
数 “ 转 化 ”为 静态 方法 ， 但 是 在 defstaticFoo() 后 跟着 staticFoo=staticmethod ue 显得 
有 多 么 的 及 有 种。 使 用 装饰 器 ， 你 现在 可 以 用 如 下 代码 替换 掉 上 面 的 : 
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class MyClass (object) : 
(staticmethod 
def staticFoo(): 


KI ^ REIS ECT Ade CIR TRIES o HECRUE CARE BITE EMT SACS 


ga o. 
fa 。 


Qdeco2 
Qdecol 


def func (Cargl, arg2, ...) : pass 
这 和 创建 一 个 组 合 函 数 是 等 价 的 。 


def func (argl, arg2, ...) : pass 


func = deco2 (decol (func) ) 
函数 组 合用 数学 来 定义 就 像 这 样 : (gf) (x) =g (f (x) ) 。 对 于 在 Python 中 的 一 致 性 : 
eg 
f 
def foo(): 


...Ej foo-g (f (foo)) 相同 
1. 有 参数 和 无 参数 的 装饰 器 
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是 的 ， 装 饰 器 语法 一 开始 有 点 让 你 犯 迷 糊 ， 但 是 一 旦 你 适应 了 ， 唯 一 会 困扰 你 的 就 是 什么 时 
候 使 用 带 参 数 的 装饰 器 。 没 有 参数 的 情况 ， 一 个 装饰 器 如 : 


(deco 


def foo(): pass 


... 非 常 地 直接 


foo = deco (foo) 
跟着 是 无 参 函 数 (如 上 面 所 见 ) 组 成 。 然 而 ， 带 参数 的 装饰 器 decomaker(): 
@decomaker (deco args) 


def foo(): pass 


需要 自己 返回 以 函数 作为 参数 的 装饰 器 。 换 和 句 话说 ，decomaker() 用 deco_args 做 了 些 事 并 返 
回 防 数 对 象 ， 而 该 函数 对 象 正 是 以 foo 作 为 其 参数 的 装饰 器 。 简 单 地 说 : 


foo = decomaker (deco args) (foo) 


这 里 有 一 个 含有 多 个 装饰 器 的 例子 ， 其 中 的 一 个 装饰 器 带 有 一 个 参数 : 


QGdecol (deco arg) 
Qàdeco2 


def func(): pass 


func = decol (deco arg) (deco2 (func) ) 


我 们 希望 如 果 你 明白 这 里 的 这 些 例子 ， 那 么 事情 就 变 得 更 加 清楚 了 。 下 面 我 们 会 给 出 简单 实 
用 的 脚本 ， 该 脚本 中 装饰 器 不 带 任何 参数 。 例 子 11.8 就 是 含有 无 参 装饰 器 的 中 间 脚 本 。 


2. 什 么 是 装饰 器 


现在 我 们 知道 装饰 器 实际 就 是 函数 。 我 们 也 知道 他 们 接受 函数 对 象 。 但 它们 是 怎样 处 理 那 些 
函数 的 呢 ? Et 当 你 包装 一 个 函数 的 时 候 ， 你 最 终 会 调用 它 。 最 棒 的 是 我 们 能 在 包装 
的 环境 下 在 合适 的 时 机 调用 它 。 我 们 在 执行 函数 之 前 ， 可 以 运行 些 预 备 代 码 ， 如 postmorrem 
分 析 ， 也 可 以 在 执行 代码 之 后 做 些 清理 工作 。 所 以 当 你 看 见 一 个 装饰 器 函数 的 时 候 ， 很 可 能 

在 里 面 找到 这 样 一 些 代 码 ， 它 定义 了 某 个 函数 并 在 定义 内 的 某 处 齿 入 了 对 目标 函数 的 调用 或 
者 至 少 一 些 引用 。 从 本 质 上 看 ， 这 些 特征 引入 了 Java 开 发 者 称呼 之 为 AOP (Aspect Oriented 
Programming， 面 向 方面 编程 ) 的 概念 。 你 可 以 考虑 在 装饰 器 中 置 入 通用 功能 的 代码 来 降低 
程序 复杂 度 。 例 如 ， 可 以 用 装饰 器 来 : 


e 引入 日 志 
e 增加 计时 逻辑 来 检测 性 能 ; 
e 给 函数 加 入 事务 的 能 力 。 


对 于 用 Python 创建 企业 级 应 用 ， 支 持 装饰 器 的 特性 是 非常 重要 的 。 你 将 会 看 到 上 面 的 条 例 与 
我 们 下 面 的 例子 有 非常 紧密 地 联系 ， n odes 导 到 了 很 好 地 体现 。 


3. 修 饰 符 举例 


下 面 我 们 有 个 极其 简单 的 例子 ， 但 是 它 应 该 能 让 你 da Mr 装 ° 
Ma T i8 db os ACE AK TA RAAN) 函数 。 -NFR 与 我 
们 在 16 章 讨论 的 时 惟 服 务 器 非常 相似 。 


这 个 装饰 器 (以 及 闭 包 ) 示范 表明 装饰 器 仅仅 是 用 来 “装饰 ”( 或 者 修饰 ) 函数 的 包装 ， 返 回 一 
个 修改 后 的 函数 对 象 ， 将 其 重新 赋值 原来 的 标识 符 ， 并 永久 失去 对 原始 函数 对 象 的 访问 。 


5111.2. 使 用 函数 装饰 器 的 例子 (deco.py) 
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$!/usr/bin/env python 
from time import ctime, sleep 
def wrappedFunc(): 


print '[$s] $s() called' $ ( 


1 
2 
3 
4 
5 def tsfunc (func) z 
6 
T 
8 ctime(), func. name ) 
9 


return func() 


10 return wrappedFunc 


12 QGtsfunc 
13 def foo(): 


14 pass 

15 

16  foo() 

17 sleep (4) 

18 

19 for i in range (2): 
20 sleep (1) 

21 foo() 


运行 脚本 ， 得 到 如 下 输出 : 


[Sun Mar 19 22:50:28 2006] foo() called 
[Sun Mar 19 22:50:33 2006] foo() called 
[Sun Mar 19 22:50:34 2006] foo() called 


4.35 41 REGE 
5 ~ 1041 


在 启动 和 模块 导入 代码 之 后 ，tsfunc() 函 数 是 一 个 显示 何 时 调用 函数 的 时 崔 的 装饰 器 。 它 定义 
了 一 个 内 部 的 函数 wrappedFunc()， 该 函数 增加 了 时 戳 以 及 调用 了 目标 函数 。 装 饰 器 的 返回 值 
是 一 个 "包装 了 "的 函数 。 


12 ~ 21 行 


BUE GAGUPGGCUAG ie 


34118] E RAE AFLAT) 来 定义 了 foo() 函 数 并 用 tsfunc() 来 装饰 。 为 证 明 我 们 的 设想 ， 
立刻 调用 它 ， 然 后 等 待 4 秒 ， 然 后 再 调用 两 次 ， 并 在 每 次 调用 前 暂停 1 秒 。 


结果 ， 函 数 立 刻 被 调用 ， 第 1 次 调用 后 ， 调 用 函数 的 第 2 个 时 间 点 应 该 为 5 (4+1) ， 第 3 次 的 时 
间 应 该 大 约 为 之 后 的 1 秒 。 这 与 上 面 看 见 的 函数 输出 十 分 吻合 。 


你 可 以 在 《Python langugae reference》、Python2.4 中 “What's New in Python 2.4" 的 文档 和 
PEP318 中 来 阅读 更 多 关于 装饰 器 的 内 容 。 


11.4 ”传递 函数 


当 学 习 一 门 C 这 样 的 语言 时 ， 元 数 指针 的 概念 是 一 个 高 级 话题 ， 但 是 对 于 函数 就 像 其 他 对 象 的 
Python 来 说 就 不 是 那么 回 事 了 。 元 数 是 可 以 被 引用 的 (访问 或 者 以 其 他 变量 作为 其 别名 ) ， 
也 作为 参数 传 入 函数 ， 以 及 作为 列表 和 字典 机 
它 同 其 他 对 象 区 分 开 来 ， 那 就 是 函数 是 可 调用 的 。 举 例 来 说 ， 可 以 通过 函数 操作 来 调用 他 们 
(在 Python 中 有 其 他 的 可 调用 对 象 。 更 多 信息 ， 参 见 14 章 ) 。 


在 以 上 的 描述 中 ， 我 们 注意 到 可 以 用 其 他 的 变量 来 作为 函数 的 别名 。 


因为 所 有 的 对 象 都 是 通过 引用 来 传递 的 ， 函 数 也 不 例外 。 当 对 一 个 变量 赋值 时 ， 实 际 是 将 相 
同 对 象 的 引用 赋值 给 这 个 变量 。 如 果 对 象 是 函数 的 话 ， 这 个 对 象 所 有 的 别名 都 是 可 调用 的 。 


>>> def foo(): 


T print 'in foo() 


>>> bar = foo 
>>> bar() 


in foo() 


类 我 们 把 foo 赋 值 给 bar 时 ，bar 和 foo 引 用 了 同一 个 函数 对 象 ， 所 以 能 以 和 调用 foo() 相 同 的 方式 
来 调用 bar()。 确 定 你 明白 “foo”( 元 数 对 象 的 引用 ) fe"foo() (io EE RH) 的 区 别 。 


稍微 深入 下 我 们 引用 的 例子 ， 我 们 甚至 可 以 把 函数 作为 参数 传 入 其 他 函数 来 进行 调用 。 


>>> def bar (argfuno) : 


es argfunc () 


Soy bar (foo) 


in foo() 


注意 到 函数 对 象 foo 被 传 入 到 bar() 中 。bar() 调 用 了 foo() (用 局 部 变量 argfunc 来 作为 其 别名 就 
如 同 在 前 面 的 例子 中 我 们 把 foo 赋 给 bar 一 样 ) 。 现 在 我 们 来 研究 下 一 个 更 加 实际 的 例子 ， 
numconv.py， 代 码 在 例子 11.3 中 给 出 。 

一 个 将 函数 作为 参数 传递 ， 并 在 函数 体内 调用 这 些 函 数 ， 更 加 实际 的 例子 。 这 个 脚本 用 传 入 
的 转换 函数 简单 将 一 个 序列 的 数 转化 为 相同 的 类 型 。 特 别 地 ，test() 有 函数 传 入 一 个 内 建 函 数 
int()、long() 或 float() 来 执行 转换 。 


例 11.3 传递 和 调用 (内 建 ) 函数 (numConv.py) 


$!/usr/bin/env python 
def convert (func, seq): 
'conv. sequence of numbers to same type' 


return [func (eachNum) for eachNum in seq] 


myseq = (123, 45.67, -6.2e8, 999999999.) 


ce -J OY ND H 


print convert (int, myseq) 


9 print convert (long, myseq) 
10 print convert (float, myseq) 


如 果 我 们 运行 这 个 程序 ， 我 们 将 会 得 到 如 下 输出 : 


$ numconv.py 

[123, 45, -620000000, 999999999] 

[123L, 45L, -620000000L, 9999999991] 
[123.0, 45.67, -620000000.0, 999999999.0] 


11.5 Formal Arguments 


Python 函数 的 形 参 集合 由 在 调用 时 要 传 入 函数 的 所 有 参数 组 成 ， 这 参数 与 函数 声明 中 的 参数 
列表 精确 地 配对 。 这 些 参数 包括 了 所 有 必要 参数 〈 以 正确 的 定位 顺序 来 传 入 函数 的 ) 、 关 键 
字 参 数 (以 顺序 或 者 不 按 顺 序 传 入 ， 但 是 带 有 参数 列表 中 曾 定义 过 的 关键 字 ) 和 所 有 含有 默 
认 值 ， 子 数 调 用 时 不 必要 指定 的 参数 。《〈 声 明 函 数 时 创建 的 ) 局 部 命名 空间 为 各 个 参数 值 ， 
创建 了 一 个 名 字 。 一 旦 函数 开始 执行 ， 就 能 访问 这 个 名 字 。 


11.5.1 位 置 参 数 


这 些 我 们 都 是 熟悉 的 标准 化 参数 。 位 置 参 数 必须 以 在 被 调用 部 数 中 定义 的 准确 顺序 来 传递 。 
另外 ， 没 有 任何 默认 参数 ( 见 下 一 个 部 分 ) 的 话 ， 传 入 函数 〈 调 用 ) 的 参数 的 精确 的 数目 必 
须 和 声明 的 数字 一 致 。 


>>> def foo (who) : # defined for only 1 argument 


print 'Hello', who 


>>> foo() & 0 arguments... BAD 
Traceback (innermost last) : 

File "«stdin»", line 1l, in ? 
TypeError: not enough arguments; expected 1, got 0 
>>> 
>>> foo ('World!') # 1 argument... WORKS 
Hello World! 
>>> 
>>> foo ('Mr.', 'World!') # 2 arguments... BAD 
Traceback (innermost last) : 

File "«stdin»", line 1, in ? 
TypeError: too many arguments; expected 1, got 2 
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少 。 否 则 你 会 频频 看 到 TypeError。 看 看 ，Python 的 错误 是 多 么 具有 信息 性 的 。 作 为 一 个 普遍 
的 规则 ， 无 论 何 时 调用 函数 ， 都 必须 提供 函数 的 所 有 位 置 参 数 。 可 以 不 按 位 置地 将 关键 字 参 


数 传 入 函数 ， 给 出 关键 字 来 匹配 其 在 参数 列表 中 的 合适 的 位 置 是 被 准予 的 《可 以 回顾 11.2.2 人 小 
节 ) 。 


由 于 默认 参数 的 特质 ， 他 们 是 函数 调用 的 可 选 部 分 。 


11.5.2 ”默认 参数 


对 于 默认 参数 如 果 在 函数 调用 时 没有 为 参数 提供 值 则 使 用 预先 定义 的 默认 值 。 这 些 定义 在 部 
数 声 明 的 标题 行 中 给 出 。 也 支持 默认 参数 ， on oo 法 ARA F RAE o i 
个 从 语法 上 来 表明 如 果 没 有 值 传 递 给 那个 参数 ， 那 么 这 个 参数 将 取 默 认 值 。 


Es 


s 


Python 中 用 默认 值 声明 变量 的 语法 是 所 有 的 位 置 参数 必须 出 现在 任何 一 个 默认 参数 之 前 。 


def func (posargs, defargl-dvall, defarg2-dval2,...): 
"function documentation string" 


function body suite 
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赋值 就 会 实现 。 


1. 为 什么 用 默认 参数 


默认 参数 让 程序 的 健壮 性 上 升 到 极 高 的 级 别 ， 因 为 它们 补充 了 标准 位 置 参 数 没 有 提供 的 一 些 
灵活 性 。 这 种 简洁 极 大 的 帮助 了 程序 员 。 当 少 几 个 需要 操心 的 参数 时 候 ， 生 活 不 再 那么 复 
杂 。 这 在 一 个 程序 员 刚 接 触 到 一 个 API 接 口 时 ， 没 有 足够 的 知识 来 给 参数 提供 更 对 口 的 值 时 显 
得 尤为 有 帮助 。 


使 用 默认 参数 的 概念 与 在 你 的 电脑 上 安装 软件 的 过 程 类 似 。 一 个 人 会 有 多 少 次 选择 默认 安装 
而 不 是 自 定 义 安装 ?了 我 可 以 说 可 能 几乎 都 是 默认 安装 。 这 既 方 便 、 易 于 操作 ， 又 能 节省 时 
间 。 总 是 选择 自 定义 安装 的 只 是 少数 人 。 


另外 一 个 让 开发 者 受益 的 地 方 在 于 ， 开 发 者 能 更 好 地 控制 为 顾客 开发 的 软件 。 当 提供 了 默认 
值 的 时 候 ， 他 们 可 以 精心 选择 “最 佳 " 的 默认 值 ， 所 以 用 户 不 需要 马上 面 对 签 琐 的 选项 。 随 着 时 
间 流 逝 ， 当 用 户 对 系统 或 者 API 越 来 越 熟悉 的 时 候 ， 他 们 最 终 能 自行 给 出 参数 值 ， 便 不 再 需要 
使 用 “学 步 车 "了 。 


下 面 这 个 例子 中 默认 参数 派 得 上 用 场 ， 并 在 日 益 增 长 的 电子 商务 中 多 少 有 些 用 处 。 


>>> def taxMe (cost, rate-0.0825) 


TE return cost + (cost * rate) 


>>> taxMe (100) 

108.25 

»»» 

>>> taxMe (100, 0.05) 

105.9 
dk Edo 4I Y > taxMe() ZA — 9B OAXACA C o TERES 1 48 E CU 48 E 
格 。 成 本 是 一 个 必需 的 参数 ， 但 税率 是 一 个 默认 参数 (在 我 们 的 例子 中 为 8.25% ) 。 或 许 你 是 
一 个 在 线 零 售 商 ， 生 意 上 的 大 部 分 客户 来 自 相同 的 州 或 者 国家 。 不 同 地 方 税率 的 顾客 期 望 看 
见 他 们 与 当地 销售 税率 相对 应 的 购买 价格 总 量 。 为 了 履 盖 默认 的 税率 ， 你 所 要 做 的 就 是 提供 


一 个 参数 值 ， 比 如 在 上 面 的 例子 中 的 taxMe (100,0.05) 。 通 过 指定 5% 税 率 ， 你 提供 了 一 个 
参数 作为 税率 参数 ， 所 以 覆盖 或 者 说 绕 过 了 0.0825 的 默认 值 。 


所 有 必需 的 参数 都 要 在 默认 参数 之 前 。 为 什么 ? 简单 说 来 就 是 因为 它们 是 强制 性 的 ， 但 默认 
参数 不 是 。 从 语法 构成 上 看 ， 对 于 解释 器 来 说 ， 如 果 允 许 混合 模式 ， 确 定 什 么 值 来 匹配 什么 
参数 是 不 可 能 的 。 如 果 没 有 按 正 确 的 顺序 给 出 参数 ， 就 会 产生 一 个 语法 错误 。 


>>> def taxMe2 (rate-0.0825, cost): 


return cost * (1.0 + rate) 
SyntaxError: non-default argument follows default argument 
让 我 们 再 看 下 关键 字 参 数 ， 用 我 们 的 老 朋 友 net_conn()。 
def net conn (host, port) : 


net conn suite 


读者 应 该 还 记得 ， 如 果 命名 了 参数 ， 这 里 可 以 不 按 顺序 给 出 参数 。 由 于 有 了 上 述 声 明 ， 我 们 
可 以 做 出 如 下 (规则 的 ) 位 置 或 者 关键 字 参 数 调 用 : 


net conn ('kappa', $8000) 


net conn (port-8080, host-'chino') 


然而 ， 如 果 我 们 将 默认 参数 引入 这 个 等 式 ， 情 况 就 会 不 同 ， 虽然 上 面 的 调用 仍然 有 效 。 让 我 
们 修改 下 net_conn() 的 声明 以 使 端口 参数 有 默认 值 80， 再 增加 另外 的 名 为 stype (服务 器 的 类 
A) 默认 值 为 tcp' 的 参数 : 


def net conn (host, port=80, stype-'tcp') 


net conn suite 


我 们 已 经 扩展 了 调用 .net_conn() 的 方式 。 以 下 就 是 所 有 对 net_conn() 有 效 的 调用 : 


. net conn('phaze', 8000, "'udp') 4 no def args used 

. net conn ('kappa') $ both def args used 
e net conn ('chino', stype='icmp') 4 use port def arg 

^ net conn (stype-'udp', host-'solo') 4 use port def arg 

. net conn ('deli'. 8080) 4$ use stype def arg 
. net conn (port-81, host-'chino') # use stype def arg 


在 上 面 所 有 的 例子 中 ， 我 们 发 现 什 么 是 一 直 不 变 的 ? 唯一 的 必须 参数 ，host。host 没 有 默认 
值 ， 所 以 他 必须 出 现在 所 有 对 net_conn() 的 调用 中 。 关 键 字 参数 已 经 被 证 明 能 给 不 按 顺 序 的 位 
置 参数 提供 参数 ， 结 合 默认 参数 ， 它 们 同样 也 能 被 用 于 跳 过 缺失 参数 ， 上 面 例子 就 是 极 好 的 
证 据 。 


2. 黑 认 函 数 对 象 参 数 举例 


给 出 ， 是 一 个 主要 目的 是 从 互联 网 上 抓 取 一 个 Web 页 面 并 暂时 储存 到 一 个 本 地 文件 中 用 于 分 
析 的 简单 脚本 。 这 类 程序 能 用 来 测试 Web 站 点 页 面 的 完整 性 或 者 能 监测 一 个 服务 器 的 负载 

(通过 测量 可 链接 性 或 者 下 载 速度 ) 。process() 函 数 可 以 做 我 们 想 要 的 任何 事 ， 表 现 出 了 无 
限 种 的 用 途 。 我 们 为 这 个 练习 选择 的 用 法 是 显示 从 Web 页 面 上 获得 的 第 一 和 最 后 的 非 空 格 
行 。 虽 然 在 现实 中 这 个 特别 的 例子 或 许 没 有 多 少 用 处 ， 但 是 你 可 以 以 这 段 代码 为 基础 ， 举 一 
反 三 。 


这 段 脚本 下 载 了 一 个 Web 页 面 (默认 为 本 地 的 万 维 网 服务 器 ) 并 显示 了 HTML 文 件 的 第 一 个 以 
及 最 后 一 个 非 空格 行 。 由 于 download() 函 数 的 双 黑 认 参 数 允 许 用 不 同 的 urls 或 者 指定 不 同 的 处 
理 函 数 来 进行 覆盖 ， 灵 活性 得 倒 了 提高 。 


111.4 抓 取 Web 页 面 (grabWeb.py) 
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&!/usr/bin/env python 
from urllib import urlretrieve 


for eachLine in lines: 


1 
2 
3 
4 
5 def firstNonBlank (lines) : 
6 
7 if not eachLine.strip(): 
8 


continue 
9 else: 
10 return eachLine 
11 
12 def firstLast (webpage) : 
13 f-open (webpage) 
14 lines-f.readlines() 
15 f.close() 
16 print firstNonBlank (lines), 
17 lines.reverse() 
18 print firstNonBlank (lines), 
19 
20 def download (url= 'http://www', 
21 process-firstLast) : 
22 try: 
23 retval = urlretrieve (Curl) [0] 
24 except IOError: 
25 retval = None 
26 if retval: # do some processing 
27 process (retval) 
28 
29 if name == ' main ': 
30 download() 


在 我 们 的 环境 下 运行 这 个 脚本 会 得 到 如 下 的 输出 ， 虽 然 你 的 内 容 是 绝对 不 同 的 ， 因 为 你 将 浏 
览 一 个 完全 不 同 的 网 页 。 
$ grabWeb.py 


, <!DOCTYPE HTML PUBLIC "—//W3C//DTD HTML 3.2 Final//EN"» 
</HTML> 
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11.6 可 变 长 度 的 参数 


可 能 会 有 需要 用 函数 处 理 可 变数 量 参 数 的 情况 。 这 时 可 使 用 可 变 长 度 的 参数 列表 。 变 长 的 参 
数 在 函数 声明 中 不 是 显 式 命 名 的 ， 因 为 参数 的 数目 在 运行 时 之 前 是 未 知 的 (其 至 在 运行 的 期 
间 ， 每 次 函数 调用 的 参数 的 数目 也 可 能 是 不 同 的 ) ， 这 和 常规 参数 (位 置 和 默认 ) 明显 不 
同 ， 常 规 参 数 都 是 在 函数 声明 中 命名 的 。 由 于 函数 调用 提供 了 关键 字 以 及 非 关 键 字 两 种 参数 
类 型 ，Python 用 两 种 方法 来 支持 变 长 参数 。 


在 11.2.4 小 节 中 ， 我 们 了 解 了 在 函数 调用 中 使 用 * 和 六 符号 来 指定 元 组 和 字典 的 元 素 作为 非 关 键 
字 以 及 关键 字 参 数 的 方法 。 在 这 个 部 分 中 ， 我 们 将 再 次 使 用 相同 的 符号 ， 但 是 这 次 在 函数 的 
声明 中 ， 表 示 在 有 函数 调用 时 接收 这 样 的 参数 。 这 语法 允许 函数 接收 在 函数 声明 中 定义 的 形 参 

之 外 的 参数 。 


11.6.1 非 关 键 字 可 变 长 参数 (AA) 


当 函 数 被 调用 的 时 候 ， 所 有 的 形 参 (必须 的 和 默认 的 ) 都 将 值 赋 给 了 在 函数 声明 中 相对 应 的 
局 部 变量 。 剩 下 的 非 关 键 字 参 数 按 顺序 插入 到 一 个 元 组 中 便于 访问 。 可 能 你 对 C 中 
的 “varargs”( 比 如 、va_list、va_arg 和 省 略 号 [...]) 很 熟悉 。Python 提 供 了 与 之 相等 的 支持 
ma 所 有 的 元 组 元 素 和 在 C 中 用 va_arg 是 相同 的 。 对 于 那些 不 熟悉 C 或 者 "varargs" 的 
这 仅仅 代表 了 在 济 数 调用 时 ， 接 受 一 个 不 定 ( 非 固 定 ) 数目 的 参数 。 


可 变 长 的 参数 元 组 必须 在 位 置 和 默认 参数 之 后 ， 带 元 组 (或 者 非 关键 字 可 变 长 参数 ) 的 函数 
普遍 的 语法 如 下 : 


def function name ([formal args,] *vargs tuple) : 
"function documentation string" 


function body suite 


星 号 操作 符 之 后 的 形 参 将 作为 元 组 传递 给 函数 ， 元 组 保存 了 所 有 传递 给 函数 的 “额外 "的 参数 
(匹配 了 所 有 位 置 和 具名 参数 后 剩余 的 ) 。 如 果 没 有 给 出 额外 的 参数 ， 元 组 为 空 。 


正如 我 们 先前 看 见 的 ， 只 要 在 函数 调用 时 给 出 不 正确 的 函数 参数 数目 ， 就 会 产生 一 个 
TypeError 异 常 。 通 过 末尾 增加 一 个 可 变 的 参数 列表 变量 ， 我 们 就 能 处 理 当 超出 数目 的 参数 被 
传 入 函数 的 情形 ， 因 为 所 有 的 额外 ( 非 关键 字 ) 参数 会 被 添加 到 变量 参数 元 组 (额外 的 关键 
字 参 数 需要 关键 字 变量 参数 [参见 下 一 小 节 ]) 。 正 如 预料 的 那样 ， 由 于 和 位 置 参 数 必须 放 在 关 
键 字 参数 之 前 一 样 的 原因 ， 所 有 的 形式 参数 必须 先 于 非 正 式 的 参数 之 前 出 现 。 


def tupleVarArgs (argl, arg2-'defaultB', *theRest) : 
'display regular args and non-keyword variable args' 
print 'formal arg 1:', argl 


' 


print 'formal arg 2:', argl 
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for eachXtrArg in theRest: 
print 'another arg:', eachXtrArg 


我 们 现在 调用 这 个 函数 来 说 明 可 变 参 数 元 组 是 如 何 工作 的 。 


>>> tupleVarArgs ('abc') 
formal arg 1 :abc 

formal arg 2:defaultB 

>>> 

>>> tupleVarArgs (23, 4.56) 
formal arg 1:23 

formal arg 2: 4.56 

»»» 

>>> tupleVarArgs ('abc', 123, 'xyz', 456.789) 
formal arg 1: abc 

formal arg 2: 123 

another arg: xyz 

another arg: 456.789 


11.6.2 ”关键 字 变 量 参数 (字典 ) 


在 我 们 有 不 定数 目的 或 者 额外 集合 的 关键 字 的 情况 中 ， 参 数 被 放 入 一 个 字典 中 ， 字 典 中 键 为 
参数 名 ， 值 为 相应 的 参数 值 。 为 什么 一 定 要 是 字典 呢 ? 因为 每 个 参数 一 一 参数 的 名 字 和 参数 
值 一 一 都 是 成 对 给 出 ， 用 字典 来 保存 这 些 参 数 自 然 就 最 适合 不 过 了 。 





这 给 出 使 用 了 变量 参数 字典 来 应 对 额外 关键 字 参 数 的 函数 定义 的 语法 : 


def function name ([formal args,][*vargst,] **vargsda) : 
function documentation string 
function body suite 


为 了 区 分 关键 字 参 数 和 非 关键 字 非 正式 和 参数， 使 用 了 双星 号 (C) 。** 是 被 重 载 了 的 以 便 不 与 
血 运 算 发 和 混淆。 关键 字 变 量 参 数 应 该 为 函数 定义 的 最 后 一 个 参数 ， 带 *。 我 们 现在 展示 一 个 
如 何 使 用 字典 的 例子 : 


def dictVarArgs (argl, arg2-'defaultB', **theRest) : 
'display 2 regular args and keyword variable args' 
print 'formal argl:', argl 
print 'formal arg2:', arg2 
for eachXtrArg in theRest.keys(): 
print 'Xtra arg $s: $s' $ \ 
(eachXtrArg, str (theRest[eachXtrArg]) ) 
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在 解释 器 中 执行 这 个 代码 ， 我 们 得 到 以 下 输出 。 


>>> dictVarArgs (1220, 740.0, ce'grail') 

formal argl: 1220 

formal arg2: 740.0 

Xtra arg c: grail 

>>> 

>>> dictVarArgs (arg2='tales', c=123, d='poe', argle'mystery') 
formal argl: mystery 

formal arg2: tales 

Xtra arg c:123 

Xtra arg d: poe 

>>> 

>>> dictVarArgs ('one', d=10, e='zoo', men- ('freud', 'gaudi') ) 
formal argl: one 

formal arg2: defaultB 

Xtra arg men: ('freud', 'gaudi') 

Xtra arg d: 10 


Xtra arg e: zoo 


关键 字 和 非 关 键 字 可 变 长 参数 都 有 可 能 用 在 同一 个 函数 中 ， 只 要 关键 字 字 典 是 最 后 一 个 参数 
并 且 非 关键 字 元 组 先 于 它 之 前 出 现 ， 正 如 在 如 下 例子 中 的 一 样 : 


def newfoo(argl,arg2,*nkw,**kw): 
display regular args and all variable args' 
print 'argl is:', argl 
print 'arg2 is:', arg2 
for eachNKW in nkw: 
print 'additional non-keyword arg:', eachNKW 
for eachKW in kw.keys(): 
print "additional keyword arg '$s': %s" $ \ 
(eachKW, kw[eachKW]) 


在 解释 器 中 调用 我 们 的 函数 ， 我 们 得 到 如 下 的 输出 : 


>>> newfoo ('wolf', 3, 'projects', freud-90, gamble-96) 
argl is: wolf 

arg2 is: 3 

additional non-keyword arg: projects 

additional keyword arg 'freud': 90 

additional keyword arg 'gamble': 96 


11.6.3 ”调用 带 有 可 变 长 参数 对 象 函 数 


在 上 面 的 11.2.4 部 分 中 ， 我 们 介绍 了 在 函数 调用 中 使 用 * 和 ** 来 指定 参数 集合 。 接 下 来 带 着 对 遂 
数 接受 变 长 参数 的 些许 偏见 ， 我 们 会 向 你 展示 更 多 那 种 语法 的 例子 。 
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我 们 现在 将 用 在 前 面部 分 定义 的 , A1 44 Æ AA A newfoo() , 来 测试 新 的 调用 语法 我 们 第 一 个 
对 newfoo() 的 调用 将 会 使 用 昌 风 格 的 方式 来 分 别 列 出 所 有 的 参数 ， 其 至 跟 在 所 有 形式 参数 之 后 
的 变 长 参数 : 


>>> newfoo (10, 20, 30, 40, fo0=50, bar-60) 
argl is: 10 ' 

arg2 is: 20 

additional non-keyword arg: 30 

additional non-keyword arg: 40 

'foo'r SU 

bar ss 60 


additional keyword arg 
additional keyword arg 


我 们 现在 进行 相似 的 调用 ; 然而 ， 我 们 将 非 关 键 字 参数 放 在 元 组 中 将 关键 字 参 数 放 在 字典 
中 ， 而 不 是 逐个 列 出 变量 参数 : 


»»» newfoo (2, 4, * (6, 8D) , **('foo': 10, 'bar': 12)) 
argl is: 2 

arg2 is: 4 

additional non-keyword arg: 6 

additional non-keyword arg: 8 

additional keyword arg 'foo': 10 


additional keyword arg 'bar': 12 


最 终 ， 我 们 将 再 另外 进行 一 次 调用 ， 但 是 是 在 函数 调用 之 外 来 创建 我 们 的 元 组 和 字典 。 


>>> aTuple = (6, 7, 8) 

>>> aDict = ['z': 9) : 

»»» newfoo (1, 2, 3, x=4, y-5, *aTuple, **aDict) 
ardi is; i 

arg2 is: 2 

additional non-keyword arg: 3 

additional non-keyword arg: 6 

additional non-keyword arg: 7 


additional non-keyword arg: 8 
additional keyword arg 'z': 9 
additional keyword arg 'x': 4 
additional keyword arg 'y': 5 
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注意 我 们 的 元 组 和 字典 参数 仅仅 是 被 调 函 数 中 最 终 接 收 的 元 组 和 字典 的 子 集 。 额 外 的 非 关 键 
字 值 ‘3' 以 及 XW 和 'y' 关 键 字 对 也 被 包含 在 最 终 的 参数 列表 中 ， 而 它们 不 是 和 %* 的 可 变 参 数 中 
的 元 素 。 


之 前 的 1.6， 过 去 变 长 对 象 只 能 通过 AR Mail 台 被 调用 函数 ， 现 在 的 调用 语法 已 经 可 以 
a 下 面 演示 了 如 何 使 用 了 这 些 符号 来 把 任意 类 型 任意 个 数 的 参数 传递 
任意 函数 对 象 。 


函数 式 编程 举例 


函 放 式 编程 的 号 外 一 个 有 用 的 应 用 出 现在 调试 和 性 能 测量 方面 上 。 你 正在 使 用 需要 每 史 都 

全 测试 或 通过 回归 ， 或 需要 给 对 潜在 改善 进行 多 次 迭代 计时 的 函数 来 工作 。 你 所 要 做 的 就 
| 建 一 个 设置 测试 环境 的 诊断 函数 ， 然 后 对 有 疑问 的 地 方 ， 调 用 函数 。 因 为 系统 应 该 是 灵 
活 的 ， 所 以 想 testee 函 数 作为 参数 传 入 。 那 么 这 样 的 函数 对 ，timeit() 和 testit()， 可 能 会 对 如 今 
的 软件 开发 者 有 帮助 。 


我 们 现在 将 展示 这 样 的 一 个 testit() 函 数 的 例子 的 源 代 码 ( 见 例 11.5) 。 我 们 将 留 下 timeit() 函 数 
作为 读者 的 练习 (见习 题 11.12) ° 


该 模块 给 函数 提供 了 一 个 执行 测试 的 环境 。testit() 却 数 使 用 了 一 个 函数 和 一 些 参数 ， 然 后 在 异 
常 处 理 的 监控 下 ， 用 给 定 的 参数 调用 了 那个 函数 。 如 果 有 函数 成 功 的 完成 ， 会 返回 True 和 函数 
的 返回 值 给 调用 者 。 任 和 何 的 失败 都 会 导致 False 和 异常 的 原因 一 同 被 返回 。 


(Exception 是 所 有 运行 时 刻 异 常 的 根 类 : 复习 第 10 章 以 获得 更 详细 的 资料 。) 
4511.5 ”测试 函数 (testit.py) 


testit() 用 其 参数 地 调用 了 一 个 给 定 的 函数 ， 成 功 的 话 ， 返 回 一 个 和 那 泡 数 返 回 值 打包 的 True 的 
返回 值 ， 或 者 False 和 失败 的 原因 。 
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1 K&!/usr/bin/env python 

2 

3 def testit(func,*nkwargs,**kwargs): 

4 

5 "Exw: 

6 retval = func(*nkwargs, **kwargs) 
7 result = (True, retval) 

8 except Exception, diag: 

9 result = (False, str(diag)) 

10 return result 

11 

12 def test(): 

13 funcs = (int,long,float) 

14 valse (1234,12.34,'1234', ' 12. 34') 

15 

16 for eachFunc in funcs: 

17 print ' '* 20 

18 for eachVal in vals: 

19 retval = testit (eachFunc, 

20 eachVal) 

21 if retval[0]: 

22 print '$S($S)-2 '$W 

23 (eachFunc. name ,"'eachVal'),retval[1] 
24 else: 

25 print '$S($3)-» FAILED:'$W 
26 (eachFunc. name ,"'eachVal'),retval[l1] 
27 


20 if name --' main ': 
29 test () 


单元 测试 函数 test() 在 一 个 为 4 个 数字 的 输入 集合 运行 了 一 个 数字 转换 函数 的 集合 。 为 了 确定 这 
样 的 功能 性 ， 在 测试 中 有 两 个 失败 的 案例 。 这 里 是 运行 脚本 的 输出 : 


Ek 
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uL 


x 
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11.7 AX AA 


Python 不 是 也 不 大 可 能 会 成 为 一 种 函数 式 编程 语言 ， 但 是 它 支持 许多 有 价值 的 函数 式 编程 语 
言 构 建 。 也 有 些 表现 得 像 函 数 式 编程 机 制 但 是 从 传统 上 也 不 能 被 认为 是 函数 式 编程 语言 的 构 
建 。Python 提 供 的 以 四 种 内 建 函 数 和 |lambda 表 达 式 的 形式 出 现 。 


11.7.4 12 5X 5lambda 


lambda [argl[, arg2, ... argN]]: expression 


python 允 许 用 lambda 关 键 字 创造 匿名 函数 。 匿 名 是 因为 不 需要 以 标准 的 方式 来 声明 ， 比 如 

说 ， 使 用 def 语 句 (除非 赋值 给 一 个 局 部 变量 ， 这 样 的 对 象 也 不 会 在 任何 的 名 称 空间 内 创建 名 
F) 。 然 而 ， 作 为 函数 ， 它 们 也 能 有 参数 。 一 个 完整 的 lambdar 语 句 "代表 了 一 个 表达 式 ， 这 
个 表达 式 的 定义 体 必须 和 上 声明 放 在 同一 行 。 我 们 现在 来 演示 下 匿名 函数 的 语法 : 


参数 是 可 选 的 ， 如 果 使 用 的 参数 话 ， 参 数 通常 也 是 表达 式 的 一 部 分 。 


核心 笔记 : lambda 表 达 式 返回 可 调用 的 函数 对 象 。 


用 合适 的 表达 式 调用 一 个 lambda 生 成 一 个 可 以 像 其 他 函数 一 样 使 用 的 函数 对 象 。 它 们 可 被 传 
给 其 他 函数 ， 用 额外 的 引用 别名 化 ， 作 为 容器 对 象 以 及 作为 可 调用 的 对 象 被 调用 (如 果 需 要 
的 话 ， 可 以 带 参 数 ) 。 当 被 调用 的 时 候 ， 如 果 给 定 相同 的 参数 的 话 ， 这 些 对 象 会 生成 一 个 和 
相同 表达 式 等 价 的 结果 。 它 们 和 那些 返回 等 价 表达 式 计算 值 相 同 的 函数 是 不 能 区 分 的 。 


在 我 们 看 任何 一 个 使 用 lambda 的 例子 之 前 ， 我 们 意欲 复习 下 单行 语句 ， 然 后 展示 下 lambda 表 
达 式 的 相似 之 处 。 


def true(): 


return True 


-E dn 83 i Zi AER RET A OE EL S I 3R True » Python F 3-41 RAT VUfe 4888 75 4E 8] — 
行 。 如 果 那 样 的 话 ， 我 们 重 写 下 我 们 的 true() 函 数 以 使 其 看 其 来 像 如 下 的 东西 : 


def true(): return True 


在 整 这 个 章节 ， 我 们 将 以 这 样 的 方式 呈现 命名 函数 ， 因 为 这 有 助 于 形象 化 与 它们 等 价 的 
lamdba 表 达 式 。 至 于 我 们 的 true() 有 函数 ， 使 用 lambda 的 等 价 表达 式 〈 没 有 参数 ， 返 回 一 个 
True) 为 : 


lambda :True 


命名 的 true() 函 数 的 用 法 相当 的 明显 ， 但 lambda 就 不 是 这 样 。 我 们 仅仅 是 这 样 用 ， 或 者 我 们 需 
要 在 某 些 地 方 用 它 进行 赋值 吗 ? 一 个 lambda 函 数 自己 就 是 无 目地 服务 ， 正 如 在 这 里 看 到 的 : 


>>> lambda :True 


«function «lambda» at f09ba0» 


4 Edad 4158 X 3x81lambdaelz£ 1 —/4- X (对 象 ) ， 但 是 既 没 有 在 任何 地 方 保 
存 它 ， 也 没有 调用 它 。 这 个 函数 对 象 的 引用 计数 在 函数 创建 时 被 设置 为 Tue， 但 是 因为 没有 
引用 保存 下 来 ， 计 数 又 回 到 零 ， 然 后 被 垃圾 回收 掉 。 为 了 保留 住 这 个 对 象 ， 我 们 将 它 保存 到 
一 个 变量 中 ， 以 后 可 以 随时 调用 。 现 在 可 能 就 是 一 个 好 机 会 。 


>>> true = lambda :True 
>>> true() 


True 


这 里 用 它 赋值 看 起 来 非常 有 用 。 相 似 地 ， 我 们 可 以 把 lambda 表 达 式 赋值 给 一 个 如 列表 和 元 组 
的 数据 结构 ， 其 中 ， 基 于 一 些 输 入 标准 ， 我 们 可 以 选择 哪些 函数 可 以 执行 ， 以 及 参数 应 该 是 
什么 〈 在 下 一 部 分 中 ， 我 们 将 展示 如 何 去 使 用 带 函 数 式 编程 构建 的 lambda 表 达 式 ) 。 

def add(x, y): returnx + y €» lambdax, y: x + y 


我 们 现在 来 设计 一 个 带 两 个 数字 或 者 字符 串 参 数 ， 返 回 数字 之 和 或 者 已 拼接 的 字符 串 的 函 
数 。 我 们 先 将 展示 一 个 标准 的 函数 ， 然 后 再 是 其 未 命名 的 等 价 物 。 


默认 以 及 可 变 的 参数 也 是 允许 的 ， 如 下 例 所 示 : 


def usuallyAdd2 (x, y=2) : return x+y < lambda x, y=2: x*y 


def showAllAsTuple (*z) : return z «€ lambda *z: z 


看 上 去 是 一 回 事 ， 所 以 我 们 现在 将 通过 演示 如 何 能 在 解释 器 中 尝试 这 种 做 法 ， 来 努力 让 你 相 


— 
gw 


>>> a = lambda x, y-2: x + y 


soo a 639) 
>>> a (3,5) 
we. & C5J 


»»» a (0,9) 


>>> b = lambda *z: z 
»5» b (23; 'zyx') 
(23, 'Zzyx'J 

»»» b (42) 


(42,2 


关于 lambda 最 后 补充 一 点 : 虽然 看 起 来 lambdda 是 一 个 函数 的 单行 版 本 ， 但 是 它 不 等 同 于 
C++ 的 内 联 语 句 ， 这 种 语句 的 目的 是 由 于 性 能 的 原因 ， 在 调用 时 绕 过 函数 的 栈 分 配 。lambda 
表达 式 运作 起 来 就 像 一 个 函数 ， 当 被 调用 时 ， 创 建 一 个 框架 对 象 。 


11.7.2 A Æ fZtapply() ` filter() ` map() ` reduce() 


在 这 个 部 分 中 ， 我 们 将 看 看 apply()、filter(), map() 及 reduce() 内 建 函 数 并 给 出 一 些 如 何 使 用 它 
们 的 例子 。 这 些 函 数 提供 了 在 python 中 可 以 找到 的 函数 式 编程 的 特征 。 正 如 你 想像 的 一 样 ， 
lambda 有 函数 可 以 很 好 地 和 使 用 了 这 些 函数 的 应 用 程序 结合 起 来 ， 因 为 它们 都 带 了 一 个 可 执行 
的 函数 对 象 ，lambda 表 达 式 提供 了 迅速 创造 这 些 函 数 的 机 制 。 
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内 um mo a 
EI 调用 C. 2 ^ PE. 学 参 PORE T4 
apply (func[, nbw)[, bw]) * | mi func, nkw 为 非 关键 学 参数 ，kw 为 关 刍 学 参数 ， 返回 值 是 函数 调用 
ET a 调用 一 个 布尔 函数 func X035 FOR UA seq POAR: 返回 一 个 使 unc 返回 值 为 ture 的 元 
filter (func, seq) | 素 的 序 5i 
ER. A d í—Á—— 
dip Mou | WU func f 用 于 给 DEF GO 的 每 个 元 素 ， 并 用 一 个 列表 来 提供 返回 什 ， 如果 func 为 
PUESTAS | None. func 表现 为 Pa. 返回 一 个 含有 人 个 序列 中 元 素 集 合 的 mn 个 元 组 的 列表 





| 将 二 元 函数 作用 于 seq 序列 的 元 素 ,每 次 携带 一 对 (先前 的 车 业 以 及 下 一 个 序列 元 素 )， 
连续 她 将 现 有 的 结果 和 下 一 个 值 作用 在 获得 的 随后 的 结果 上 ， 最 后 减少 我 们 的 序列 为 
4r 4 — 0) 3 fo] (ft invo init 给 定 ， 第 一 个 比较 会 是 init MAAAR 
不 是 摩 列 的 飞 两 个 元 天 
a。 可 以 有 效 地 取代 1.6， 在 其 后 的 Python 版 本 中 还 半 询 法 ， 


b， 由 于 在 Python2.0 H., PARRA EGIA., WERI. 







reduce (func, seg], inir]) 





1. *apply() 


正如 前 面 提 到 的 ， 函 数 调 用 地 语法 ， Rp bM mE EE M , 
Æ Pythonl.6 F A xÈ T apply() » 3X 4 f ZEE e EO o JE TRGROROR PR ARRA o 
我 们 在 这 里 提 及 这 个 函数 既是 为 了 介 erus w E h TP RA applay() $ Zi $4 4X5 8 B 
的 。 

2. filter() 

OO BO pe m E 
树 上 采 下 的 苹果 。 如 果 你 能 通过 e 衰 中 好 的 苹果 留 下 ， 不 是 一 件 很 令 人 开心 
的 事 吗 ? 六 el en 主要 前 。 给 定 一 个 对 象 的 序列 和 一 个 “过 滤 ? 函 数 ， 每 个 序列 元 
素 都 通过 这 个 过 滤器 进行 第 选 a Rc 
调用 给 25s 函数 。 每 个 filter 返 回 的 非 零 (true) 值 元 素 添加 到 一 个 列表 中 。 返 回 的 对 象 是 一 
个 从 原始 队列 中 “过 滤 后 "的 队列 。 


如 果 我 们 想 要 用 纯 Python 编 写 filter()， 它 或 许 就 像 这 样 : 


def filter (bool func, seq) : 
filtered seq = [] 
for eachlItem in seq: 
if bool func (eachItem) 
filtered seq.append (eachItem) 


return filtered seq 


一 种 更 好 地 理解 filter() 的 方法 就 是 形象 化 其 行为 。 图 11-1 试 着 那样 做 。 


编程 439 





seq[0]  seq(1]  seq[2] seq[N-1] 


"filtered" 
filtered seq 
seq[1] seq[2] filter() 
(fillered seq[0]) (fillered seq[1]) 





11-1. 内 建 函数 filter() 是 如 何 工作 的 


在 图 11-1 中 ， 我 们 观察 到 我 们 原始 队列 在 顶端 ， 一 个 大 小 为 n 的 队列 ， 元 素 从 eq[0] ，seq[1] ， 
...Seq[N-1]。 每 一 次 对 bool func() 的 调用 ， 举 例 来 说 ，bool func (seq[1]) ^ 

bool func (seq[0]) 等 ， 每 个 为 True 或 False 的 返回 值 都 会 回 现 。 (AX Boolean $ Zi 65 4e 4- 
定义 一 一 确保 你 的 函数 确实 返回 一 个 站 或 假 ) 。 如 果 bool_func() 给 每 个 序列 的 元 返回 一 个 

卜 ， 那 个 元 素 将 会 被 插入 到 返回 的 序列 中 。 当 迭代 整个 序列 已 经 完成 ，filter() 返 回 一 个 新 创建 
的 序列 。 我 们 下 面 展示 在 一 个 使 用 了 filer() 来 获得 任意 奇数 的 简短 列表 的 脚本 。 该 脚本 产生 一 
个 较 大 的 随机 数 集合 ， 然 后 过 滤 出 所 有 的 的 偶数 ， 留 给 我 们 一 个 需要 的 数据 集 。 当 一 开始 编 

写 这 个 例子 的 时 候 ，oddnogen.py 如 下 所 示 : 


from random import randint 


def odd (n) 


return n $ 2 


allNums = [] 
for eachNum in range (9) : 
allNums.append (randint (1, 99) ) 
print filter (odd, allNums) 
代码 包括 两 个 函数 : odd() ^ sog — 4 SEL EAR (UR) 或 者 偶数 〈 假 ) Boolean » UR. 


main()， 主 要 的 驱动 部 件 。main() 的 目的 是 来 产生 10 个 在 1~100 的 随机 数 : 然后 调用 filter() 来 
移 除 掉 所 有 的 偶数 。 最 后 ， 先 显示 出 我 们 过 滤 列 表 的 大 小 ， 然 后 是 奇数 的 集合 。 


导入 和 运行 这 个 模块 几 次 后 ， 我 们 能 得 到 如 下 输出 : 
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$ python oddnogen.py 
[8, 33, 595, $5] 
$ python oddnogen.py 
[39, VJ, 295 Mls 4] 
$ python oddnogen.py 
[23, 39, 9, l1, 63, 91] 
$ python oddnogen.py 
ai; B5, 83, 5S3, 3] 
第 一 次 重 构 
在 第 二 次 浏览 时 ， 我 们 注意 到 odd() 是 非常 的 简单 的 以 致 能 用 一 个 lambda 表 达 式 替换 : 


from random import randint 
allNums = [] 
for eachNum in range (9) : 


allNums.append (randint (1, 99) ) 
print filter (lambda n: n$2, allNums) 


第 二 次 重 构 
我 们 已 经 提 到 list 综 合 使 用 如 何 能 成 为 filter() 合 适 的 替代 者 ， 如 下 便 是 : 


from random import randint 


allNums = [] 
for eachNum in range (9) : 
allNums.append (randint (1, 99) ) 


print [n for n in allNums if n$2] 
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我 们 通过 整合 另外 的 列表 解析 将 我 们 最 后 的 列表 放 在 一 起 ， 来 进一步 简化 我 们 的 代码 。 正 如 
你 如 下 看 到 的 一 样 ， 由 于 列表 解析 灵活 的 语法 ， 就 不 再 需要 一 个 暂时 的 变量 了 (为 了 简单 ， 
我 们 用 一 个 较 短 的 名 字 将 randint() 倒 入 到 我 们 的 代码 中 ) 。 


from random import randint as ri 
print [n for n in [ri (1,99) for i in range (9) ] if nà2] 


3. map() 


map() 内 建 函 数 与 filter() 相 似 ， 因 为 它 也 能 通过 函数 来 处 理 序列 。 然 而 ， 不 像 filter()、map() 将 
函数 调用 “映射 "到 每 个 序列 的 元 素 上 ， 并 返回 一 个 含有 所 有 返回 值 的 列表 。 


在 最 简单 的 形式 中 ，map() 带 一 个 函数 和 队列 ， 将 函数 作用 在 序列 的 每 个 元 素 上 ， 然 后 创建 由 
。 所 以 如 果 你 的 映射 函数 是 给 每 个 进入 的 数字 加 2， 并 且 你 将 
文 个 函数 和 一 个 数字 的 列表 传 给 map()， 返 回 的 结果 列表 是 和 原始 集合 相同 的 数字 集合 ， 但 是 
2 如 果 我 们 要 用 Python 编写 这 个 简单 形式 的 map() 如 何 运作 的 ， 它 可 能 像 在 
图 11-2 中 冰释 的 如 下 代码 : 


def map (func, seq): 
mapped seq - [] 
for eachItem in seq: 


mapped seq.append (func (eachItem) ) 


return mapped seq 


seq[0]  seq[1]  seq[?2] seq(A—-1] 


func(seq[0]) func(seq[2]) func(seq[A-1]) 
func(seq[1]) map () 





图 11-2. ”内 建 函 数 map() 是 如 何 工作 的 


我 们 可 以 列举 一 些 简短 的 lambda 函 数 来 展示 如 何 用 map() 处 理 实 际 数据 : 
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>>> map ( (lambda x: x*2) ，[0，1，2，3，4，5]) 
[2, 3, 4, 5, 6, 7) 
>>> 


>>> map (lambda x: x**2, range (6) ) 

[0, m 4, 9, 16, 25] 

>>> [x*2 for x in range (6) ] 

[2, 3, 4, S, 6, F 

>>> 

>>>[x**2 for x in range (6) ] 

[0, is 4, 9, 16, 25] 
我 们 已 经 讨论 了 有 时 map() 如 何 被 列表 解析 取代 ， 所 以 这 里 我 们 再 分 析 下 上 面 的 两 个 例子 。 形 
式 更 一 般 的 map() 能 以 多 个 序列 作为 其 输入 。 如 果 是 这 种 情况 ， 那 么 map() 会 并 行 地 迭代 每 个 
序列 。 在 第 一 次 调用 时 ，map() 会 将 每 个 序列 的 第 一 个 元 素 捆 绑 到 一 个 元 组 中 ， 将 func 函 数 作 
用 到 map() 上 ， 当 map() 已 经 完成 执行 的 时 候 ， 并 将 元 组 的 结果 返回 到 mapped_seq 映 射 的 ， 
最 终 以 整体 返回 的 序列 上 。 图 11-2 阅 述 了 一 个 map() 如 何 和 单一 的 序列 一 起 运行 。 如 果 我 们 用 
带 有 每 个 序列 有 NN 个 对 象 的 M 个 序列 来 的 map()， 我 们 前 面 的 图 表 会 转变 成 如 图 11-3 中 展示 的 
图 表 那 样 。 








“PC ta oe E NE, 


func(seq1[0], seq2[0], ... seqM[0]) ftunc(seq1[N-1], ... seqM[N-1]) 
| func(seq1[1], seq2[1], ... seqM[1]) 







map(í) 





图 11-3 内 建 函 数 map() 如 何 和 >1 的 序列 一 起 运作 


这 里 有 些 使 用 带 多 个 序列 的 map() 的 例子 。 
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22» map (lambda x, y: x * y, [1,3,5], [2,4,65]D 


[3, 7, 11] 
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>>> map (lambda x, y: (xty, x-y) , [1,3,5], [2,4,6])) 
[ C3, < 47, -1) ; ‘Cl -173 

»»» 


>>> map (None, [1,3,5], [2,4,6]】) 


L0, 29, w, ). (S, 6] 
上 面 最 后 的 例子 使 用 了 map() 和 一 个 为 None 的 函数 对 象 来 将 不 相关 的 序列 归并 在 一 起 。 这 种 
思想 在 一 个 新 的 内 建 函 数 ，zip， 被 加 进来 之 前 的 python2.0 是 很 普遍 的 。 而 zip 是 这 样 做 的 : 


»»» dp CIIL,3,95], [2,4,6]? 
[ t1, 205, $3, 41, £5, 82] 


4. reduce() 


函数 式 编程 的 最 后 的 一 部 分 是 reduce()，reduce 使 用 了 一 个 三 元 函数 (一 个 接收 带 两 个 值 作为 
输入 ， 进 行 了 一 些 计算 然后 返回 一 个 值 作为 输出 )， 一 个 序列 ， 和 一 个 可 选 的 初始 化 器 ， 剖 
有 成 效 地 将 那个 列表 的 内 容 “ 减 少 "为 一 个 单一 的 值 ， 如 同 它 的 名 字 一 样 。 在 其 他 的 语言 中 ， 这 
Ab ML A AGREE E 2] Ape o 


过 取出 序列 的 头 两 个 元 素 ， 将 他 们 传 入 二 元 函数 来 获得 一 个 单一 的 值 来 实现 。 然 后 又 用 
E 个 序列 的 内 容 痢 遍历 完毕 以 及 
最 后 的 值 会 被 计算 出 来 为 止 。 


你 可 以 尝试 去 形象 化 reduce 如 下 面 的 等 同 的 例子 


reduce (func, [1, 2, 3]) = func (func (1, 22 , 3) 


有 些 人 认为 reduce() 合 适 的 函数 式 使 用 每 次 只 需要 仅 需 要 一 个 元 素 。 在 上 面 一 开始 的 迭代 中 ， 
我 们 拿 了 两 个 元 素 因为 我 们 没有 从 先前 的 值 (因为 我 们 没有 任何 先前 的 值 ) 中 获 3 USE 5 
果 ”。 这 就 是 可 选 初始 化 器 出 现 的 地 方 (参见 下 面 的 init 变 量 ) 。 如 果 给 定 初始 化 器 ， 那 么 

始 的 迭代 会 用 初始 化 器 和 一 个 序列 的 元 素来 进行 ， 接 着 和 正常 的 一 样 进行 


如 果 我 们 想 要 试 着 用 纯 Python 实 现 reduce()， 它 可 能 会 是 这 样 : 
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def reduce (bin func,seq,init-None) : 


Iseq-list (seq) & convert to list 
if init is None: # initializer? 
res = lseq.pop (0) = no 
else: 
res = init E yes 
for item in lseq: # reduce sequence 
res = bin func (res, item) # apply function 
return res # return result 


从 概念 上 说 这 可 能 4 个 中 最 难 的 一 个 ， 所 以 我 们 应 该 再 次 向 你 演示 一 个 例子 以 及 一 个 函数 式 图 
表 ( 见 图 11-4) 。reduce() 的 “hello world” 是 其 一 个 简单 加 法 函数 的 应 用 或 在 这 章 前 面 看 到 的 
与 之 等 价 的 lamda: 


e def mySum (x,y) : return x*y 
e lambda x,y: x*y 


0 1 2 N-2 N-1 


s0 [] O 









reduce () 


(a) 结果 的 值 为 bin-func Kseq[0], seq(1]) 
(b) 结果 的 值 为 bin-func (bin func (seq[0], seq[1]) , seq[2]) , etc. 


图 11-4 reduce() 内 建 函 数 是 如 何 工 作 的 


给 定 一 个 列表 ， 我 们 可 以 简单 地 创建 一 个 循环 ， 迭 代 地 遍历 这 个 列表 ， 再 将 现在 元 素 加 到 前 
面 元 素 的 累加 和 上， 最 后 当 循 环 结束 就 能 获得 所 有 值 的 总 和 。 
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>>> def mySum (x,y) : return x+y 
>>> allNums = range (5) *F[0, l2, 3, 43] 


>>> total = 0 


>>> for eachNum in allNums: 


total = mySum (total, eachNum) 


2»» print 'the total is:', total 


the total is: 10 


使 用 ambda 和 reduce()， 可 以 以 一 行 代码 做 出 相同 的 事情 。 


> print 'the total is:', reduce ( (lambda x,y: xty) range (5) ) 


the total 


给 出 了 上 面 的 输入 ，reduce() 函 数 运行 了 如 下 的 算术 操作 。 
和 一 10 


用 list 的 头 两 个 元 素 (0，1) ， 调 用 mySum() 来 得 到 1， 然 后 用 现在 的 结果 和 下 一 个 元 素 2 来 再 
次 调用 mySum()， 再 从 这 次 调用 中 获得 结果 ， 与 下 面 的 元 素 3 配 对 然后 调用 mySum()， 最 终 拿 
整个 前 面 的 求 和 ，4 来 调用 mySum() 得 到 10, 10 即 为 最 终 的 返回 值 。 


11.7.3 偏 函 数 应 用 


currying 的 概念 将 函数 式 编程 的 概念 和 默认 参数 以 及 可 变 参 数 结合 在 一 起 。 一 个 带 n 个 参数 ， 
curried 的 元 数 固化 第 一 个 参数 为 固定 参数 ， 并 返回 另 一 个 带 n-1 个 参数 函数 对 象 ， 分 别 类 似 于 
LISP 的 原始 函数 car 和 cdr 的 行为 。Currying 能 泛 化 成 为 偏 函 数 应 用 ( partial function 
application > PFA) ， 这 种 函数 将 任意 数量 【顺序 ) 的 参数 的 函数 转化 成 另 一 个 带 剩 余 参 数 的 
函数 对 象 。 


在 某 种 程度 上 ， 这 似乎 和 不 提供 参数 ， 就 会 使 用 默认 参数 情形 相似 。 在 PFA 的 例子 中 ， 参 数 不 
需要 调用 函数 的 默认 值 ， 只 需 明 确 的 调用 集合 。 你 可 以 有 很 多 的 偏 函 数 调用 ， 每 个 都 能 用 不 
同 的 参数 传 给 函数 ， 这 便 是 不 能 使 用 默认 参数 的 原因 。 


这 个 特征 是 在 Python2.5 的 时 候 被 引入 的 ， 通 过 functools 模 块 能 很 好 地 被 用 户 调用 。 
1. 简 单 的 函数 式 例子 


如 何 创 建 一 个 简单 小 巧 的 例子 呢 ? 我 们 来 使 用 下 两 个 简单 的 函数 add() 和 mul()， 两 者 都 来 自 
operator 模 块 。 这 两 个 函数 仅仅 是 我 们 熟悉 的 + 和 * 操 作 符 的 函数 式 接 口 ， 举 例 来 说 ，add (x, 
y) 与 X+y 一 样 。 在 我 们 的 程序 中 ， 我 们 经 常 想 要 给 和 数字 加 一 或 者 乘 以 100。 


除了 大 量 的 ， 如 add (1,foo) , add (1,bar) , mul (100,foo) , mul (100,bar) 般 的 调用 ， 
拥有 已 存在 的 并 使 函数 调用 简化 的 函数 不 是 一 件 很 美妙 的 事 吗 ? 举例 来 说 ，addl (foo) ^ 
addi (bar) 、mul100， 但 是 却 不 用 去 实现 函数 addl() 和 mul100()? 哦 ， 现 在 用 PFA 你 就 可 以 这 
样 做 。 你 可 以 通过 使 用 functional 模 块 中 的 partial() 函 数 来 创建 PFA : 


> from operator import add, mul 
>>> from functools import partial 
>>> addl = partial (add, 1) # addl (x) == add (1l, x) 


>>> mul100 = partial (mul, 100) # mull00 (x) == mul (100, x?) 
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>>> addl (1) 

2 

>>> mull00 (10) 
1000 


>>> mull100 (500) 
50000 


这 个 例子 或 许 不 能 让 你 看 到 PFA 的 威力 ， 但 是 我 们 不 得 不 从 从 某 个 地 方 开始 。 当 调用 带 许多 参 
数 的 函数 的 时 候 ，PFA 是 最 好 的 方法 。 使 用 带 关键 字 参 数 的 PFA 也 是 较 简 单 的 ， 因 为 能 显示 给 
出 特定 的 参数 ， 要 么 作为 curried 参 数 ， 要 么 作为 那些 更 多 在 运行 时 刻 传 入 的 变量 ， 并 且 我 们 
不 需 担 心 顺序 。 下 面 的 一 个 例子 来 自 Python 文 档 中 关于 在 应 用 程序 中 使 用 ， 在 这 些 程序 中 需 
要 经 常 将 二 进 制 (作为 字符 串 ) 转换 成 为 整 型 。 


>>> baseTwo = partial (int, basez2) 

>>> baseTwo. doc = 'Convert base 2 string to an int.' 

>>> baseTwo ('10010') 

18 
这 个 例子 使 用 了 int() 内 建 函 数 并 将 base 固 定 为 2 来 指定 二 进 制 字符 串 转 化 。 现 在 我 们 没有 多 次 
用 相同 的 第 二 参数 (2) 来 调用 int()， 比 如 (10010 * 2). ， 相 反 ， 可 以 只 用 带 一 个 参数 的 新 
baseTwo() 函 数 。 接 着 给 新 的 《部 分 ) 函数 加 入 了 新 的 文档 并 又 一 次 很 好 地 使 用 了 "函数 属 
性 ”( 见 上 面 的 11.3.4 部 分 ) ， 这 是 很 好 的 风格 。 要 注意 的 是 这 里 需要 关键 字 参 数 base。 


2. 警 惕 关键 字 


如 果 你 创建 了 不 带 base 关 键 字 的 偏 函 数 ， 比 如 ，baseTwo-BAD=partial (int, 2) ， 这 可 能 会 
让 参数 以 错误 的 顺序 传 入 int()， 因 为 固定 参数 的 总 是 放 在 运行 时 刻 参 数 的 左边 ， 比 如 
baseTwoBAD (x) =int (2，x) 。 如 果 你 调用 它 ， 它 会 将 2 作为 需要 转化 的 数字 ，base 作 
为 10010' 来 传 入 ， 接 着 产生 一 个 异常 : 

>>> baseTwoBAD = partial (int, 2) 

>>> baseTwoBAD ('10010') 

Traceback (most recent call last) : 

File "«stdin»", line 1, in «module» 

TypeError: an integer is required 
由 于 关键 字 放 置 在 恰当 的 位 置 ， 顺 序 就 得 固定 下 来 ， 因 为 ， 如 你 所 知 ， 关 键 字 参数 总 是 出 现 
在 形 参 之 后 ， 所 以 baseTwo (x) ==int (x> base=2) » 


3. 简 单 GUI 类 的 例子 


PFA 也 扩展 到 所 有 可 调用 的 东西 ， 如 类 和 方法 。 一 个 使 用 PFA 的 优秀 的 例子 是 提供 了 "部 分 gui 
模范 化 "。GUI 小 部 件 通常 有 很 多 的 参数 ， 如 文本 、 长 度 、 最 大 尺寸 、 背 景 和 前 景色 、 活 动 或 
者 非 活动 ， 等 等 。 如 果 想 要 国定 其 中 的 一 些 参数 ， 如 让 所 有 的 文本 标签 为 蓝 底 和 白字 ， 你 可 以 
准确 地 以 PFA 的 方式 ， 自 定义 为 相似 对 象 的 伪 模 板 。 


这 是 较 有 用 的 偏 函 数 应 用 的 例子 ， 或 者 更 准确 的 说 ，" 部 分 类 实例 化 ".……. 为 什么 呢 ? 


$!/usr/bin/env python 


1 
2 
3 from functools import partial 
4 import Tkinter 

5 

6 


root- Tkinter.Tk() 
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7 MyButton = partial (Tkinter.Button, root, 
8 fg='white', bg-'blue') 

9 bl = MyButton (text='Button 1') 

10 b2 = MyButton (text='Button 2') 

11 qb = MyButton (text-'QUIT', bg='red', 
12 commanderoot.quit) 

13 bl.packl() 

14 b2.pack() 

15  qb.pack (fill-Tkinter.X, expand-True) 
16  root.title ('PFAs!') 

17  root.mainloop() 


在 7~8 行 ， 我 们 给 TkinterButton 创 建 了 "部 分 类 实例 化 器 ”" (因为 那 便 是 它 的 名 字 ， 而 不 是 偏 函 
数 ) ， 国 定好 父 类 的 窗口 参数 然后 是 前 景色 和 背景 色 。 我 们 创建 了 两 个 按钮 bl 和 b2 来 与 模板 匹 
配 ， 只 让 文本 标签 唯一 。quit 按 钮 《11 一 12 行 ) 是 稍微 自 定义 过 的 ， 带 有 不 同 的 背景 色 【〈 红 
E B xA EE) 并 配置 了 一 个 回调 的 函数 ， 当 按钮 被 按 下 的 时 候 ， 关 闭 窗口 (另外 
的 两 个 按钮 没有 函数 ， 当 他 们 被 按 下 的 时 候 ) o 


没有 MyButton“ 模 板 " 的 话 ， 你 每 次 会 不 得 不 使 用 “完全 "的 语法 (因为 你 仍然 没有 给 全 参数 ， 由 
于 有 大 量 你 不 传 入 的 ， 含 有 默认 值 的 参数 ) 


bl = Tkinter.Button (root, fgs'white', bg='blue', text='Button 1') 
b2 = Tkinter.Button (root, fg*»'white', bg»'blue', text='Button 2') 
qb = Tkinter.Button (root, fge'white', textes'QUIT', bg*'red', 


command*root.quit) 


这 就 一 个 简单 的 GUI 的 截图 : 


A 


Button 2 


IP SEEME, Hs Oo IS on on 
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当 你 的 代码 可 以 变 得 更 紧凑 和 易 读 的 时 候 ， 为 什么 要 还 有 重复 的 做 令 人 心烦 的 事 ? 你 能 在 第 
18 章 找到 更 多 关于 GUI 编程 的 资料 ， 在 那 我 们 着 重 描写 了 一 个 使 用 PFA 的 例子 。 从 你 迄今 为 止 
看 到 的 内 容 中 ， 可 以 发 现 ， 在 以 更 函数 化 编程 环境 提供 默认 值 方面 ，PFA 带 有 模板 以 及 “style- 
sheeting” 的 感觉 。 你 可 以 在 《Python Library Reference) (Python 库 参考 ) ，《Whats New 
in Python 2.5》 文 档 和 指定 的 PEP309 里 ， 关 于 functools 模 块 的 文档 中 阅读 到 更 多 关于 pfa 的 资 
料 。 


11.8 变量 作用 域 


标识 符 的 作用 域 是 定义 为 其 声明 在 程序 里 的 可 应 用 范围 ， 或 者 即 是 我 们 所 说 的 变量 可 见 性 
换 名 话说， 就 好 像 在 问 你 自己 ， 你 可 以 在 程序 里 的 哪些 部 分 去 访问 一 个 制定 的 标识 符 。 变 量 
可 以 是 局 部 域 或 者 全 局 域 。 


11.8.1 全 局 变量 与 局 部 变量 


定义 在 函数 内 的 变量 有 局 部 作用 域 ， 在 一 个 模块 中 最 高 级 别 的 变量 有 全 局 作用 域 。 在 编译 器 
理论 里 著名 的 “ 龙 书 ”中 ， 阿 霍 、 塞 西 和 乌 尔 曼 作 了 如 下 总 结 : 

“声明 适用 的 程序 的 范围 被 称 为 了 声明 的 作用 域 。 在 一 个 过 程 中 ， 如 果 名 字 在 过 程 的 声明 之 
内 ， 它 的 出 现 即 为 过 程 的 局 部 变量 ; 否则 的 话 ， 出 现 即 为 非 局 部 。” 


全 局 变量 的 一 个 特征 是 除非 被 删除 掉 ， 和 否则 它们 的 存活 到 脚本 运行 结束 ， 且 对 于 所 有 的 函 
数 ， 他 们 的 值 都 是 可 以 被 访问 的 ， 然 而 局 部 变量 ， 就 像 它们 存放 的 栈 ， 暂 时 地 存在 ， 仅 仅 只 
依赖 于 定义 它们 的 函数 现 阶 段 是 否 处 于 活动 。 当 一 个 函数 调用 出 现时 ， 其 局 部 变量 就 进入 
明 它 们 的 作用 域 。 在 那 一 刻 ， 一 个 新 的 局 部 变量 名 为 那个 对 象 创建 了 ， 一 旦 函数 完成 ， x 
被 释放 ， 变 量 将 会 离开 作用 域 。 
global str = 'foo' 

def foo(): 

local str = 'bar' 


return global str + local str 


LA AN ， global_str 是 全 局 变量 ， 而 local_str 是 局 部 变量 。foo() 函 数 可 以 对 全 局 和 局 部 
量 进行 访问 ， 而 代码 的 主体 部 分 只 能 访问 全 局 变量 。 


核心 笔记 : 搜索 标识 符 (也 称 变量 ， 名 字 ， 等 等 ) 


当 搜 索 一 个 标识 符 的 时 候 ，Python 先 从 局 部 作用 域 开 始 搜索 。 如 果 在 局 部 作用 域内 没有 找到 
那个 名 字 ， 那 么 就 一 定 会 在 全 局 域 找到 这 个 变量 否则 就 会 被 抛 出 NameError 措 常 。 一 个 变量 的 
作用 域 和 它 寄 住 的 名 称 空间 相关 。 我 们 会 在 第 12 章 正式 介绍 名 称 空间 ; 对 于 现在 只 能 说 子 空 
间 仅 仅 是 将 名 字 映 射 到 对 象 的 命名 领域 ， 现 在 使 用 的 变量 名 字 虚 拟 集合 。 作 用 域 的 概念 和 用 
于 找到 变量 的 名 称 空间 搜索 顺序 相关 。 当 一 个 函数 执行 的 时 候 ， 所 有 在 局 部 命名 空间 的 名 字 
都 在 局 部 作用 域内 。 那 就 是 当 查找 一 个 变量 的 时 候 ， 第 一 个 被 搜索 的 名 称 空 间 。 如 果 没 有 在 
那 找 到 变量 的 话 ， 那 么 就 可 能 找到 同名 的 全 局 变量 。 这 些 变量 存储 (搜索 ) 在 一 个 全 局 及 内 
建 的 名 称 空间 。 


仅仅 通过 创建 一 个 局 部 变量 来 "隐藏 "或 者 覆盖 一 个 全 局 变量 是 有 可 能 的 。 回 想 一 下 ， 局 部 名 称 
空间 是 首先 被 搜索 的 ， 存 在 于 其 局 部 作用 域 。 如 果 找 到 一 个 名 字 ， 搜 索 就 不 会 继续 去 寻找 一 
个 全 局 域 的 变量 ， 所 以 在 全 局 或 者 内 建 的 名 称 空间 内 ， 可 以 覆盖 任何 匹配 的 名 字 。 


同样 ， 当 使 用 全 局 变量 同名 的 局 部 变量 的 时 候 要 小 心 。 如 果 在 赋予 局 部 变量 值 之 前 ， 你 在 本 
数 中 (为 了 访问 这 个 全 局 变量 ) 使 用 了 这 样 的 名 字 ， 你 将 会 得 到 一 个 异常 (NAMEERROR 或 
者 Unbound-LocalError) ， 而 这 取决 于 你 使 用 的 Python 版 本 。 


11.8.2 globa 4 


如 果 将 全 局 变量 的 名 字 声 明 在 一 个 函数 体内 的 时 候 ， 全 局 变量 的 名 字 能 被 局 部 变量 给 覆盖 
掉 。 这 里 有 另外 的 例子 ， 与 第 一 个 相似 ， 但 是 该 变量 的 全 局 和 局 部 的 特性 就 不 是 那么 清晰 


def foo(): 
print "Mncalling foo().. 
bar = 200 
print "in foo(), bar is", bar 
bar = 100 
print "in main , bar is", bar 
foo() 


print "Mnin malin , bar ls (still) ", bar 


得 到 如 下 输出 : 


in main , bar is 100 
calling foo()... 
in foo(), bar is 200 


in main , bar is (still) 100 


我 们 局 部 的 bar 将 全 局 的 bar 推 出 了 局 部 作用 域 。 为 了 明确 地 引用 一 个 已 命名 的 全 局 变量 ， 必 须 
使 用 global 语 句 。global 的 语法 如 下 : 


global varl[, var2[, ... varN]]] 


修改 上 面 的 例子 ， 可 以 更 新 我 们 代码 ， 这 样 我 们 便 可 以 用 全 局 版 本 的 is_this_global 而 无 须 创 
建 一 个 新 的 局 部 变量 。 
>>> is this global = 'xyz' 
>>> def foo(): 
global is this global 
this is local = "apeg! 
is this global = 'def' 


print this is local + is this global 


>>> foo() 

abcdef 

>>> print is this global 
def 


11.8.8 ”作用 域 的 数字 


Python 从 语法 上 支持 多 个 函数 齿 套 级 别 ， 就 如 在 Python2. 1 中 的 ， 匹 配 静 态 谋 套 的 作用 域 。 然 
而 ， 在 2. 1 之 前 的 版 本 中 ， 最 多 为 两 个 作用 域 : 一 个 函数 的 局 部 作用 域 和 全 局 作用 域 。 虽 然 存 
在 多 个 函数 的 谋 套 ， 但 你 不 能 访问 超过 两 个 作用 域 。 
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def foo(): 
m = 3 
def bar(): 
n = 4 
print m + n 
print m 
bar () 


虽然 这 代码 在 今天 能 完美 的 运行 


>>> foo() 
3 
y 


在 Python2.1 之 前 执行 它 将 会 产生 错误 。 


第 A Z E a SX X 2 ga 
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453 


>>> foo() 

Traceback (innermost last) 
File "stdin»", lins 1, in 2 
Fille "«stdin»", line 7, in foo 
File "«stdin»", line 5, in bar 


NameError: m 


在 函数 bar() 内 访问 foo() 的 局 部 变量 m 是 非法 的 ， 因 为 m 是 声明 为 foo() 的 局 部 变量 。 从 bar() 中 
可 访问 唯一 的 作用 域 为 局 部 作用 域 和 全 局 作用 域 。foo() 的 局 部 作用 域 没有 包含 在 上 面 两 个 作 
用 域 的 列表 中 。 注 意 'print m' 语 名 的 输出 成 功 了 ， 而 对 bar() 的 函数 调用 却 失 败 了 。 幸 运 的 是 ， 
由 于 Python 的 现 有 具 套 作用 语 规则 ， 今 天 就 不 存在 这 个 问题 了 。 


11.8.4 闭 包 


由 于 Python 的 静态 上 谋 套 域 ， 如 我 们 早先 看 到 的 ， 定 义 内 部 函数 变 得 很 有 用 处 。 在 下 面 的 部 分 
中 ， 我 们 将 着 重 讨论 作用 域 和 lambda， 但 是 在 Python 2. 1 之 前 ， 当 作用 域 规 改 则 变 为 今天 这 
样 之 前 ， 内 部 函数 也 会 遭受 到 相同 的 问题 。 如 果 在 一 个 内 部 函数 里 ， 对 在 外 部 作用 域 (但 不 
是 在 全 局 作用 域 ) 的 变量 进行 引用 ， 那 么 内 部 函数 就 被 认为 是 闭 包 (closure) 。 定 义 在 外 部 
函数 内 的 但 由 内 部 函数 引用 或 者 使 用 的 变量 被 称 为 自由 变量 。 闭 包 在 函数 式 编程 中 是 一 个 重 
要 的 概念 ，Scheme 和 Haskell 便 是 函数 式 编程 中 两 种 。 闭 包 从 语法 上 看 很 简单 (和 内 部 函数 
一 样 简单 ) 但 是 仍然 很 有 威力 。 


闭 包 将 内 部 函数 自己 的 代码 和 作用 域 以 及 外 部 函数 的 作用 结合 起 来 。 闭 包 的 词法 变量 不 属于 
全 局 名 称 空间 域 或 者 局 部 的 一 一 而 属于 其 他 的 名 称 空间 ， 带 着 “流浪 ”的 作用 域 。 (注意 这 不 同 
于 对 彰 因 为 那些 变量 是 存活 在 一 个 对 从 的 名 称 空间 但 是 闭 包 变量 存活 在 一 个 函数 的 名 称 空间 
和 作用 域 ) 那么 为 什么 你 会 想 要 用 闭 包 ? 


闭 包 对 于 安装 计算 、 隐 藏 状态 和 在 函数 对 象 和 作用 域 中 随意 地 切换 是 很 有 用 的 。 闭 包 在 GUI 或 
者 在 很 多 API 支 持 回调 函数 的 事件 驱动 编程 中 是 很 有 些 用 处 的 。 以 绝对 相同 的 方式 ， 应 用 于 获 
取 数 据 库 行 和 处 理 数 据 。 回 调 就 是 函数 。 闭 包 也 是 函数 ， 但 是 他 们 能 携带 一 些 额 外 的 作用 
域 。 它 们 仅仅 是 带 了 额外 特征 的 函数 .…… 另外 的 作用 域 。 


你 可 能 会 觉得 闭 包 的 使 用 和 这 章 先前 介绍 的 偏 函 数 应 用 非常 的 相似 ， 但 是 与 闭 包 的 使 用 相 
比 ，PFA 更 像 是 currying， 因 为 闭 包 和 函数 调用 没 多 少 相 关 ， 而 是 关于 使 用 定义 在 其 他 作用 域 


的 变量 。 


1. 简单 的 闭 包 的 例子 


下 面 是 使 用 闭 包 简单 的 例子 。 我 们 会 模拟 一 个 计数 器 ， 同 样 也 通过 将 整 型 包 衰 为 一 个 列表 的 
单一 元 素来 模拟 使 整 型 易 变 。 


def counter (start at=0) 
count = [start at] 
def incr(): 
count[0] += 1 
return count[0] 


return incr 


counter() 做 的 唯一 一 件 事 就 是 接受 一 个 初始 化 的 值 来 开始 计数 ， 并 将 该 值 赋 给 列表 count 唯 一 
一 个 成 员 。 然 后 定义 一 个 incr() 的 内 部 函数 。 通 过 在 内 部 使 用 变量 count， 我 们 创建 了 一 个 闭 

包 ， 因 为 它 现 在 携带 了 整个 counter() 作 用 域 。incr() 增 加 了 正在 运行 的 count 然 后 返回 它 。 然 后 
最 后 的 魔法 就 是 counter() 返 回 一 个 incr， 一 个 〈 可 调用 的 ) 部 数 对 象 。 如 我 们 交互 地 运行 这 个 
函数 ， 将 得 到 如 下 的 输出 注意 这 看 起 来 和 实例 化 一 个 counter 对 象 并 执行 这 个 实例 有 多 么 
相似 : 





>>> count = counter (5) 


> print count() 


>>> print count() 


>>> count2 = counter (100) 


>>> print count2() 


101 


55» print count() 
8 


有 点 不 同 的 是 我 们 能 够 做 些 原来 需要 我 们 写 一 个 类 做 的 事 ， 并 且 不 仅仅 是 要 写 ， 还 必需 覆盖 
掉 这 个 类 的 call () 特 别 方法 来 使 他 的 实例 可 调用 。 这 里 我 们 能 够 使 用 一 对 函数 来 做 这 件 事 。 


现在 ， 在 很 多 情况 下 ， 类 是 最 适合 使 用 的 。 闭 包 更 适合 需要 一 个 必需 有 自己 的 作用 域 的 回调 
函数 情况 ， 尤 其 是 回调 函数 是 很 小 巧 而 且 简 单 的 ， 通 常 也 很 聪明 。 跟 平常 一 样 ， 如 果 你 使 用 
了 闭 包 ， 对 你 的 代码 进行 注释 或 者 用 文档 字符 串 来 解释 你 正 做 的 事 是 很 不 错 的 主意 。 


2. 追踪 闭 包 词 法 的 变量 


下 面 两 个 部 分 包含 了 给 高 级 读者 的 材料 ...... 如 果 你 愿意 的 话 ， 你 可 以 跳 过 去 。 我 们 将 讨论 如 
何 能 使 用 函数 的 func_closure 属 性 来 追踪 自由 变量 。 这 里 有 个 显示 追踪 的 代码 片段 。 


如 果 我 们 运行 这 段 代码 ， 将 得 到 如 下 输入 : 


no fl closure vars 

f2 closure vars: ['«cell at 0x5ee30: int object at 
0x200377c»'] 

£3 closure vars: ['«cell at 0x5ee90: int object at 
0x2003770»', '«cell at 0x5ee30: int object at 
0x200377c»'] 

«int 'w' idz0x2003788 val=1> 
'x' id20x200377c val=2> 

«int 'y' id-0x2003770 val=3> 
'z' id-0x2003764 valz4» 


«int 


«int 


这 个 例子 说 明了 如 何 能 通过 使 用 函数 的 func closure 属 性 来 追踪 闭 包 变量 。 


Python 核心 编程 第 二 版 


1 k'/usr/bin/env python 
2 
3 output = '«int r id-*£$0x val-$&d»' 
4 w=x=y=2=1 
5 
6 def f1(): 
7 X=y=2Z=2 
8 
9 def f2(): 
10 y"z3 
11 
12 def £3 (): 
13 z-4 
14 print output% ('w',id (w) ,w) 
15 print output$* ('x',id (x) ,x) 
16 print output$ ('y',id (y) ,y) 
17 print output* ('z', id (z) ,z) 
18 
19 clo = f3.func closure 
20 if clo: 
21 print "f3 closure vars:", [str (c) for c in clo] 
22 else: 
23 print "no f3 closure vars" 
24 £3() 
25 
26 clo = f2.func closure 
21 if clo: 
28 print "f2 closure vars:", [str (c) for c ín clo] 
29 else: 
30 print "no f2 closure vars" 
31 £20 
32 
33 clo * fl.func closure 
34 áf clo: 
35 print "fl closure vars:", [str (c) for c ín clo] 
36 else: 
37 print "no fl closure vars" 
38 £10 

3.， 乏 行 解释 

1-44T 


这 段 脚本 由 创建 模板 来 输出 一 个 变量 开始 : 它 的 名 字 、ID 和 值 ， 然 后 设置 变量 Ww、x、y 和 Zz。 
我 们 定义 了 模板 ， 这 样 便 不 需要 多 次 拷贝 相同 输出 格式 的 字符 串 。 


6~9、26 ~ 31 行 


第 11 章 “函数 和 函数 式 编程 il 


fi() & 3 £5 EL 6,46 6| E — AE 31 E x ^ ydez o VUA — AERE ^ (注意 所 有 的 
局 部 变量 遮蔽 或 者 隐藏 了 对 他 们 同名 的 全 局 变量 的 访问 ) o de RREA TIET 85 E LENA 
用 域 的 变量 ， 比 如 说 ， 非 全 局 的 和 非 f2() 的 局 部 域 的 ， 那 么 它们 便 是 自由 变量 ， 将 会 被 
fl.func_closure 追 踪 到 。 


9~10、19~24 行 


这 几 行 实际 上 是 对 fl() 的 找 贝 ， 对 f2() 做 相同 的 事 ， 定 义 了 局 部 变量 y 和 Zz， 以 及 对 一 个 内 部 函数 
f3()。 此 外 ， 这 里 的 局 部 变量 会 遮蔽 全 局 以 及 那些 在 中 间 局 部 化 作用 域 的 变量 ， 如 fl() 。 如 果 
对 于 f3() 有 任何 的 自由 变量 ， 他 们 会 在 这 里 显示 出 来 。 


毫 无 疑问 ， 你 会 注意 到 对 自由 变量 的 引用 是 存储 在 单元 对 象 里 ， 或 者 简单 地 说 ， 单 元 。 这 些 
东西 是 什么 呢 ? 单元 是 在 作用 域 结束 后 使 自由 变量 的 引用 存活 的 一 种 基础 方法 。 

举例 来 说 ， 我 们 假设 函数 f3() 已 经 被 传 入 到 其 他 一 些 函 数 ， 这 样 便 可 在 稍 后 ， 甚 至 是 f2() 完 成 
之 后 调用 它 。 你 不 想 要 让 f2() 的 栈 出 现 ， 因 为 即使 我 们 仅仅 在 乎 f3() 使 用 的 自由 变量 ， 栈 也 会 
让 所 有 的 f2()'s 的 变量 保持 存活 。 单 元 维持 住 自由 变量 以 便 人 2() 的 剩余 部 分 能 被 释放 掉 。 


12 ~ 17 行 


Dj: 


个 部 分 描绘 了 f3() 的 定义 ， 创 建 一 个 局 部 的 变量 z。 接 着 显示 WwW、X、y、Z， 这 4 个 变量 从 最 内 
作用 域 逐 步 向 外 的 追踪 到 的 。 在 f3() 、f2() 或 fl() 中 都 是 找 不 到 变量 w 的 ， 所 以 这 是 个 全 局 变 
量 。 在 f3() 或 者 f2() 中 ， 找 不 到 变量 x， 所 以 来 自 fl() 的 闭 包 变量 。 相 似 地 ，y 是 一 个 来 自 f2() 的 闭 
包 变 量 。 最 后 ，z 是 f3() 的 局 部 变量 。 


3e 


ul 


33 ~ 38 行 


main() 中 剩余 的 部 分 尝试 去 显示 人 l() 的 闭 包 变量 ， 但 是 什么 都 不 会 发 生 因为 在 全 局 域 和 fl() 的 作 
用 域 之 间 没 有 任何 的 作用 域 一 一 没有 fl() 可 以 借用 的 作用 域 ， 因 此 不 会 创建 闭 包 一 一 所 以 第 34 
行 的 条 件 表 达 式 永远 不 会 求 得 True。 这 里 的 这 段 代 码 仅 仅 是 有 修饰 的 目的 。 





4. “高 级 闭 包 和 装饰 器 的 例子 


回 到 11. 3. 6 部 分 ， 我 们 看 到 了 一 个 使 用 闭 包 和 装饰 器 的 简单 例子 ，deco.py。 接 下 来 就 是 稍微 
高 级 点 的 例子 ， 来 给 你 演示 闭 包 的 申 正 的 威力 。 应 用 程序 “logs” 兄 数 调用 。 用 户 选 择 是 要 在 隐 
数 调用 之 前 或 者 之 后 ， 把 函数 调用 写 入 日 志 。 如 果 选 择 贴 日 志 ， 执 行 时 间 也 会 显示 出 来 。 


这 个 例子 演示 了 带 参 数 的 装饰 器 ， 该 参数 最 终 决 定 哪 一 个 闭 包 会 被 用 的 。 这 也 是 闭 包 的 威力 
的 特征 。 


Python 核心 编程 第 二 版 


$:/usr/bin/env python 


from time import time 


i 

2 

3 

El 

5 def logged (when) : 

6 def log (f,*args,**kargs) ; 
7 print '''Called: 
8 function: ts 

9 args: *r 

10 kargs: *r''' & (f, args, kargs) 


11 

12 def pre logged (£): 

13 def wrapper (*args, **kargs) : 

14 log (f, *args, **kargs) 

15 return f (*args, **kargs) 

16 return wrapper 

17 

18 def post logged (f) : 

19 def wrapped (*args, **kargs) 

20 nowetime() 

21 try: 

22 return f (*args, **kargs) 
23 finally: 

24 log (f, *args, **kargs) 
25 print "time delta: às" * (rime()-now) 
26 return wropper 

27 

28 try: 

29 return ("pre": pre logged, 

30 "post": post logged] [when] 

31 except KeyError, e: 

32 raise ValueError (e) , 'must be "pre" or "post"' 
33 


34  81ogged ("post") 
35 def heilo (name) : 
36 print "Hello,", name 


38 hello ("World!*) 
如 果 执 行 这 个 脚本 ， 你 将 会 得 到 和 下 面相 似 的 输出 : 


$ funcLog.py 
Hello, World! 
Called: 
function: «function hello at 0x555f0» 
args: ('World!',) 
kargs: () 
time delta: 0.000471115112305 


5. 未 行 解释 


5~10、28 ~ 32 行 
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这 段 代 码 描绘 了 logged() 函 数 的 核心 部 分 ， 其 职责 就 是 获得 关于 何 时 函数 调用 应 该 被 写 入 日 志 
的 用 户 请 求 。 它 应 该 在 目标 防 数 被 调用 前 还 是 之 后 呢 ?logged() 有 3 个 在 它 的 定义 体 之 内 的 助 
手 内 部 函数 : log(), pre_logged() 和 post_logged()。 log() 是 实际 上 做 日 志 写 入 的 函数 。 它 仅仅 
是 显示 标准 输出 函数 的 名 字 和 参数 。 如 果 你 愿意 在 “ 实 的 世界 中 "使 用 该 函数 的 话 ， 你 很 有 可 
能 会 把 输出 写 到 一 个 文件 、 数 据 库 或 者 标准 错误 (sys.stderr) ° logged()/£28— 324155 3/6 
的 部 分 实际 上 是 函数 中 非 函 数 声明 的 最 开始 的 代码 。 读 取 用 户 的 选择 然后 返回 |ogged() 有 函数 
中 的 一 个 便 能 用 目标 泡 调 用 并 包 衰 它 。 


12 ~ 26 行 


Eea 


pre logged()?epost logged()4f A & X E 4s RARER CGA P EXCEL A?” Wio $ 87h 
数 已 经 执行 之 后 ，post_loggeed() 会 将 函数 调用 写 入 日 志 ， 而 pre_logged() 则 是 在 执行 之 前 。 


根据 用 户 的 选择 ，pre_logged() 和 post logged() 其 中 之 一 会 被 返回 。 当 这 个 装饰 器 被 调用 的 时 
候 ， 首 先 对 装饰 器 和 其 参数 进行 求 值 ， 比 如 logged (时 间 ) 。 然 后 返回 的 函数 对 象 作为 目标 
的 函数 的 参数 进行 调用 ， 比 如 ，pre logged (f) 或 者 post logged (f) ° 


两 个 *|logged() 元 数 都 包括 了 一 个 名 为 Wrapper() 的 闭 包 。 当 合适 将 其 写 入 日 志 的 时 候 ， 它 便 会 
调用 目标 函数 。 这 个 函数 返回 了 和 包 计 好 的 函数 对 象 ， 该 对 象 随 后 将 被 重新 赋值 给 原始 的 目标 
RAE o 


34 ~ 3847 


ix BE A 8* 3 3-38 2-8 3-36 t T hello() £& Z E JE 7E] 1 2x 3d 09 d EU RATE o 3 104638 
行 调用 hello() 的 时 候 ， 它 和 你 在 35 行 创建 的 函数 对 象 已 经 不 是 一 回 事 了 。34 行 的 装饰 器 用 特 
殊 的 装饰 将 原始 函数 对 象 进行 了 包 右 并 返回 这 个 包 衷 后 的 hello() 版 本 。 


11.8.5 ”作用 域 和 lambda 


Python 的 lambda 匿 名 元 数 遵循 和 标准 函数 一 样 的 作用 域 规则 。 一 个 lambda 表 达 式 定义 了 新 的 
作用 域 ， 就 像 函 数 定义 ， 所 以 这 个 作用 域 除了 局 部 lambda 函 数 ， 对 于 程序 其 他 部 分 ， 该 作用 
域 都 是 不 能 对 进行 访问 的 。 


那些 声明 为 函数 局 部 变量 的 lambda 表 达 式 在 这 个 函数 体内 是 可 以 访问 的 ; 然而 ， 在 lambda 语 
名 中 的 表达 式 有 和 元 数 相同 的 作用 域 。 你 也 可 以 认为 函数 和 一 个 lambda 表 达 式 是 同胞 。 


x = 10 

def foo(): 
y = 5 
bar = lambda :x-*y 
print bar() 


现在 知道 这 段 代码 能 很 好 的 运行 。 
>> fo0() 
15 


然而， 我们 必须 在 回顾 下 过 去 ， 去 看 下 原来 的 python 版 本 中 让 代码 运行 必需 的 ， 一 种 极 
其 普遍 的 做 法 。 在 2. 1 之 前 ， 我 们 将 会 得 到 一 个 错误 ， 如 同 你 在 下 面 看 到 的 一 样 ， 因 为 函数 和 
lambda 都 可 访问 全 局 变量 ， 但 两 者 都 不 能 访问 彼此 的 局 部 作用 域 。 

>>> foo() 
Traceback (innermost last) : 
File "«stdin»", line 1, in ? 
File "«stdin»", line 4, in foo 
File "«stdin»", line 3, in «lambda» 


NameError: y 


在 上 面 的 例子 中 ， 虽 然 lambda 表 达 式 在 foo() 的 局 部 作用 域 中 创建 ， 但 他 仅仅 只 能 访问 两 个 作 
AR: 它 自己 的 局 部 作用 域 和 全 局 的 作用 域 (同样 见 11. 8. 3 小 节 ) 。 解 决 的 方法 是 加 入 一 个 
变量 作为 默认 参数 ， 这 样 我 们 便 能 从 外 面 的 局 部 作用 域 传递 一 个 变量 到 内 部 。 在 我 们 上 面 的 
例子 中 ， 我 们 将 lambda 的 那 一 行 修改 成 这 样 : 


bar = lambda y-y: x+y 


由 于 这 个 改变 ， 程 序 能 运行 了 。 外 部 y 的 值 会 作为 一 个 参数 传 入 ， 成 为 局 部 的 y (lambda $ žk 
的 局 部 变量 ) 。 你 可 以 在 所 有 你 遇 到 的 Python 代码 中 看 到 这 种 普遍 的 做 法 ; 然而 ， 这 不 表明 
存在 改变 外 部 y 值 的 可 能 性 ， 比 如 : 


x = 10 
def foo(): 
y= 5 
bar = lambda y=y: x+y 
print bar() 
y= 8 
print bar() 


输出 "完全 错误 ”: 


>>> Test) 
15 
13 


原 EIVA EE T amd tue ， 所 以 虽然 其 值 在 稍 后 改变 了 ， 但 是 lambda 的 定 
没 JR o 十 唯一 > > eceb u E 2 
义 没 有 变 。 那 时 唯一 替代 的 方案 就 是 在 lambda 表 达 式 中 加 入 对 函数 局 部 变量 y 进 行 引用 的 局 部 


X EZ. 


x — 10 

def foo(): 
y= 5 
bar = lambda z:x-*z 
print bar (y) 
y= 8 
print bar (y) 


为 了 获得 正确 的 输出 所 有 的 一 切 都 是 必需 的 : 


>>> roO) 
L5 
18 


这 同样 也 不 可 取 因 为 现在 所 有 调用 bar() 的 地 方 都 必需 改 为 传 入 一 个 变量 。 从 Python2.1 开 始 ， 
在 没有 任何 修改 的 情况 下 整个 程序 都 完美 的 运行 。 


x = 10 
def foo(): 


< 
Il 
on 


bar = lambda :x-*y 
print bar (y) 


y= 8 

print bar (y) 
>> foo() 
13 
18 


3E 58 00 $$ A UE (RA) 被 加 入 到 Python 中 ， 你 会 不 高 兴 吗 ?许多 老 前 人 草 一 定 不 会 。 你 可 
以 在 PEP 227 中 阅读 到 更 多 关于 这 个 重要 改变 的 信息 


11.8.6 ”变量 作用 域 和 名 称 空 间 


从 我 们 在 这 章 的 学 习 中 ， 我 们 可 以 看 见 任 何 时 候 ， 总 有 一 个 或 者 两 个 活 亏 
也 不 少 。 我 们 要 么 在 只 能 访问 全 局 作用 域 的 模块 的 最 高 级 ， 要 么 在 一 个 我 们 能 访问 函数 局 部 
作用 域 和 全 局 作用 域 的 函数 体内 执行 。 名 称 空间 是 怎么 和 作用 域 关 联 的 呢 ? 





从 11. 8. 1 小 节 的 核心 笔记 中 ， 我 们 也 可 以 发 现 ， 在 任何 给 定 的 时 间 ， 存 在 两 个 或 者 三 个 的 活 
动 的 名 称 空间 。 从 函数 内 部 ， e 围 了 局 部 名 称 空间 ， 第 一 个 搜寻 名 字 的 地 方 。 如 
果 名 字 存 在 的 话 ， 那 么 将 跳 过 检查 全 局 作用 域 (全 局 和 内 建 的 名 称 空间 ) o 


我 们 现在 将 给 出 例子 11. 9， 一 个 到 处 混合 了 作用 域 的 脚本 。 我 们 将 确定 此 程序 输出 作为 练习 
留 给 读者 。 


局 部 变量 隐藏 了 全 局 变量 ， 正 如 在 这 个 变量 作用 程序 中 显示 的 。 程 序 的 输出 会 是 什么 〈 以 及 
为 什么 ) 呢 ? 


def 上 ) 
t 
print "j == %d and k &d" k) 
J def 5 à 
2 6 
3 ) 
4 print "j == $d and k == Xd" 1 1, k) 
) 
K = 
8 proci () 
9 print " i ar ) 
) 
2 pr 
23 print "j == $d and k == q" 


12.3.1 小 节 有 更 多 关于 名 称 空间 和 变量 作用 域 的 信息 。 


11.9 “递归 


如 果 函 数 包 含 了 对 其 自身 的 调用 ， 该 函数 就 是 递归 的 。 根 据 Aho、Sethi 和 Ullman,“[a] 如 果 一 个 
新 的 调用 能 在 相同 过 程 中 较 早 的 调用 结束 之 前 开始 ， 那 么 该 过 程 就 是 递归 ”。 

递归 广泛 地 应 用 于 语言 识别 和 使 用 递归 函数 的 数学 应 用 中 。 在 本 文 的 早先 部 分 ， 我 们 第 一 次 
看 到 了 我 们 定义 的 阶乘 函数 : 


N! 三 factorial (N) 


Il 
rr 
* 
MN 
* 
G9 
»* 
Z 


我 们 可 以 用 这 种 方式 来 看 阶乘 : 


factorial (N) = N! 


N * N-1)! 
-N* (N-1) * (N-2) ! 


l) 


N* (N-1) * (N-2) ...*3*2*1 


我 们 现在 可 以 看 到 阶乘 是 递归 的 ， 因 为 factorial (N) =N* factorial (N-1) 。 换 和 句 话说 ， 为 了 
获得 factorial (N) 的 值 ， 需 要 计算 factorial (N-1) 。 而 有 全， 为 了 找到 factorial (N-|) ， 需 要 
计算 factorial (N-2) 等 。 我 们 现在 给 出 阶乘 函数 的 递归 版 本 。 


def factorial (n) : 
if n =a 0 or n == I> $ 0l = 1i! = 1l 
return 1 
else: 


return (n * factorial (n-1) ) 


11.10 ER 


早先 在 第 8 章 ， 我 们 讨论 了 迭代 器 背后 的 有 效 性 以 及 它们 如 何 给 非 序 列 对 象 一 个 像 序列 的 迭代 
器 接口 。 这 很 容易 明白 因为 他 们 仅仅 只 有 一 个 方法 ， 用 于 调用 获得 下 个 元 素 的 next(). 


然而 ， 除 非 你 实现 了 一 个 迭代 器 的 类 ， 和 帮 代 器 站 正 的 并 没有 那么 “聪明 "。 难 道 调用 函数 还 没有 
强大 到 在 和 迭代 中 以 某 种 方式 生成 下 一 个 值 并且 返 回 和 next() 调 用 一 样 简单 的 东西 ? 那 就 是 生成 
器 的 动机 之 一 。 生 成 器 的 另外 一 个 方面 甚至 更 加 强力 一 一 协同 程序 的 概念 。 协 同 程序 是 可 以 

运行 的 独立 函数 调用 ， 可 以 暂停 或 者 挂 起 ， 并 从 程序 离开 的 地 方 继续 或 者 重新 开始 。 在 有 调 

用 者 和 (被 调用 的 ) 协同 程序 也 有 通信 。 举 例 来 说 ， 当 协同 程序 暂停 的 时 候 ， 我 们 能 从 其 中 

获得 一 个 中 间 的 返回 值 ， 当 调用 回 到 程序 中 时 ， 能 够 传 入 额外 或 者 改变 了 的 参数 ， 但 仍 能 够 

从 我 们 上 次 离开 的 地 方 继续 ， 并 且 所 有 状态 完整 。 挂 起 返回 出 中 间 值 并 多 次 继续 的 协同 程序 

被 称 为 生成 器 ， 那 就 是 Python 的 生成 器 丨 正在 做 的 事 。 在 2. 2 的 时 候 ， 生 成 器 被 加 入 到 Python 
中 接着 在 2. 3 中 成 为 标准 (IPEP 255) ， 虽 然 之 前 足够 强大 ， 但 是 在 Python2. 5 的 时 候 ， 得 
到 了 显著 的 提高 ( 见 PEP 342) 。 这 些 提 升 让 生成 器 更 加 接近 一 个 完全 的 协同 程序 ， 因 为 允 

许 值 (和 异常 ) 能 传 回 到 一 个 继续 的 函数 中 。 同 样 地 ， 当 等 待 一 个 生成 器 的 时 候 ， 生 成 器 现 

在 能 返回 控制 。 在 调用 的 生成 器 能 挂 起 (返回 一 个 结果 ) 之 前 ， 调 用 生成 器 返回 一 个 结果 而 

不 是 阻塞 等 待 那 个 结果 返回 。 让 我 们 更 进一步 观察 生成 器 自 顶 向 下 的 启动 。 


什么 是 Python 式 的 生成 器 ?从 语法 上 讲 ， 生 成 器 是 一 个 带 yield 语 句 的 函数 。 一 个 函数 或 者 子 
程序 只 返回 一 次 ， 但 一 个 生成 器 能 暂停 执行 并 返回 一 个 中 间 的 结果 一 一 那 就 是 yield 语 句 的 功 
能 ， 返 回 一 个 值 给 调用 者 并 暂停 执行 。 当 生成 器 的 next() 方 法 被 调用 的 时 候 ， 它 会 准确 地 从 高 
开 地 方 继续 ( 当 它 返回 [一 个 值 以 及 ] 控 制 给 调用 者 时 ) 。 


当 在 2.2 生 成 器 被 加 入 的 时 候 ， 因 为 它 引 入 了 一 个 新 的 关键 字 ，yield， 为 了 向 下 兼容 ， 你 需要 
从 future 模 块 中 导入 generators 来 使 用 生成 器 。 从 2.3 开 始 ， 当 生成 器 成 为 标准 的 时 候 ， 这 就 不 
再 是 必需 的 了 。 


11.10.1 简单 的 生成 器 特性 


与 迭代 器 相似 ， 生 成 器 以 另外 的 方式 来 运作 : 当 到 达 一 个 卜 正 的 返回 或 者 函数 结束 没有 更 多 
的 值 返 回 ( 当 调用 next()) ， 一 个 Stoplteration 异 常 就 会 抛 出 。 这 里 有 个 例子 ， 简 单 的 生成 


go。 
m 


def simpleGen(): 
yield 1 
vield 'Z ==> punch!' 


现在 我 们 有 自己 的 生成 器 函数 ， 让 我 们 调用 他 来 获得 和 保存 一 个 生成 器 对 象 (以 便 我 们 能 调 
用 它 的 next() 方 法 从 这 个 对 象 中 获得 连续 的 中 间 值 ) 


>>> myG = simpleGen() 
>>> myG.next() 
1 
>>> myG.next() 
'2 --» puncht!" 
>>> myG.next() 
Traceback (most recent call last): 
File "", line 1, in ? 
myG.next() 
StopIteration 


由 于 Python 的 for 循 环 有 next() 调 用 和 对 Stoplteration 的 处 理 ， 使 用 一 个 for 循 环 而 不 是 手动 迭代 
穿 过 一 个 生成 器 (或 者 那 种 事物 的 迭代 器 ) 总 是 要 简洁 漂亮 得 多 。 
>>> for eachItem in simpleGen(): 


print eachItem 


1 
'2 --» punch!' 


当然 这 是 个 有 点 策 拙 的 例子 LOB EAR REIR M AEREE ? Te S SUR A ERRE 
越 序列 ， 而 这 需要 函数 威力 而 不 是 已 经 在 某 个 序列 中 静态 对 象 。 


在 接 下 来 的 例子 中 ， 我 们 将 要 创建 一 个 带 序 列 并 从 那个 序列 中 返回 一 个 随机 元 素 的 随机 迭代 


ot o. 
m 


from random import randint 
def randGen (aList) : 
while len (aList) » O0: 


yield aList.pop (randint (0, len (aList) ) ) 


不 同 点 在 于 每 个 返回 的 元 素 将 从 那个 队列 中 消失 ， 像 一 个 list.pop() 和 random.choice() 的 结合 
的 归 类 。 


>>> for item in randGen (['rock', 'paper', 'scissors']): 


print item 


scissors 


rock 


paper 


在 接 下 来 的 几 章 中 ， 当 我 们 谈 到 面向 对 象 编程 的 时 候 ， 将 看 见 这 个 生成 器 较 简单 (和 无 限 ) 
的 版 本 作为 类 的 迭代 器 。 在 之 前 的 8. 12 小 节 中 ， 我 们 讨论 了 生成 器 表达 式 的 语法 。 使 用 这 个 
语法 返回 的 对 象 是 个 生成 器 ， 但 只 以 一 个 简单 的 形式 ， 并 允许 使 用 过 分 简单 化 的 列表 解析 的 


语法 。 


这 些 简单 的 例子 应 该 让 你 有 点 明白 生成 器 是 如 何 工 作 的 ， 但 你 或 许 会 问 ， "在 我 的 应 用 中 ， 我 
可 以 在 哪 使 用 生成 器 ? ”或许 ， 你 会 问 " 最 适合 使 用 这 些 个 强大 的 构建 的 地 方 在 哪 ?” 


使 用 生成 器 最 好 的 地 方 就 是 当 你 正和 迭代 穿越 一 个 巨大 的 数据 集合 ， 而 重复 迭代 这 个 数据 集合 
是 一 个 很 麻烦 的 事 ， 比 如 一 个 巨大 的 磁盘 文件 ， 或 者 一 个 复杂 的 数据 库 查询 。 对 于 每 行 的 数 
据 ， 你 希望 执行 非 元 素 的 操作 以 及 处 理 ， 但 当 正 指向 和 和 迭代 过 它 的 时 候 ， 你 “不 想 失 去 你 的 地 


你 想 要 抓 取 一 块 数据 ， 比 如 ， 将 它 返 回 给 调用 者 来 处 理 以 及 可 能 的 对 (另外 一 个 ) 数据 库 的 
插入 ， 接 着 你 想 要 运行 一 次 next() 来 获得 下 一 块 的 数据 ， 等 等 。 状 态 在 挂 起 和 再 继续 的 过 程 中 
是 保留 了 的 ， 所 以 你 会 觉得 很 舒服 有 一 个 安全 的 处 理 数据 的 环境 。 没 有 生成 器 的 话 ， 你 的 程 
序 代码 很 有 可 能 会 有 很 长 的 函数 ， 里 面 有 一 个 很 长 的 循环 。 当 然 ， 这 仅仅 是 因为 一 个 语言 这 
样 的 特征 不 意味 着 你 需要 用 它 。 如 果 在 你 程序 里 没有 明显 适合 的 话 ， 那 就 别 增加 多 余 的 复杂 
性 ! 当 你 遇 到 合适 的 情况 时 ， 你 便 会 知道 什么 时 候 生成 器 正 是 要 使 用 的 东西 。 


11.10.2 ”加强 的 生成 器 特性 


在 Python2. 5 中 ， 一 些 加 强 特性 加 入 到 生成 器 中 ， 所 以 除了 next() 来 获得 下 个 生成 的 值 ， 用 户 
可 以 将 值 回 送 给 生成 器 [send()]， 在 生成 器 中 抛 出 异常 ， 以 及 要 求生 成 器 退出 [close()]。 


由 于 双向 的 动作 涉及 叫做 send() 的 代码 来 向 生成 器 发 送 值 (以 及 生成 器 返回 的 值 发 送 回来 ) > 
现在 yield 语 句 必须 是 一 个 表达 式 ， 因 为 当 回 到 生成 器 中 继续 执行 的 时 候 ， 你 或 许 正在 接收 一 
个 进入 的 对 象 。 下 面 是 一 个 展示 了 这 些 特性 的 ， 简 单 的 例子 。 我 们 用 简单 的 闭 包 例子 ， 
counter: 
def counter (start at-0) : 
count = start at 
while True: 
val = (yield count) 
if val is not None: 
count = val 
else: 
count += 1 
生成 器 带 有 一 个 初始 化 的 值 ， 对 每 次 对 生成 器 [next() ] 调 用 以 1 累加 计数 。 用 户 已 可 以 选择 重 
置 这 个 值 ， 如 果 他 们 非常 想 要 用 新 的 值 来 调用 send() 不 是 调用 next()。 这 个 生成 器 是 永远 运行 


的 ， 所 以 如 果 你 想 要 终结 它 ， 调 用 close() 方 法 。 如 果 我 们 交互 的 运行 这 段 代码 ， 会 得 到 如 下 
输出 : 
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>>> count = counter (5) 


>>> count.next () 


>>> count.next () 


>>> count.send (9) 


>>> count.next () 

10 

>>> count.close() 

>>> count.next () 

Traceback (most recent call last) : 
File "«stdin»", line 1, in «module» 


StopIteration 


你 可 以 在 PEP 25512 PEP 342 中 ， 以 及 为 读者 介绍 Python2. 2 中 新 特性 的 文章 中 阅读 到 更 多 关 
于 生成 器 的 资料 : 


http://www. linuxjournal.com/article/5597 


11.11 练习 


11-1. 参 数 。 比 较 下 面 3 个 函数 : 
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def countToFourl(): 
for eachNum in range (5) 
print eachNum, 
def countToFour2 (n) 


for eachNum in range (n, 5) 


print eachNum, 

def countToFour3 (n=1) 
for eachNum in range (n, 5): 

print eachNum, 


给 定 如 下 的 输入 直到 程序 输出 ， 你 认为 会 发 生 什 么 ? 向 下 表 11. 2 填 入 输出 。 如 果 你 
认为 给 定 的 输入 会 发 生 错误 的 话 十 入 “ERROR” 或 者 如 果 没 有 输出 的 话 填 


A"NONE" ° 
11-2. 43. o 4 GM 2 21 5-289 RE > AERA E — A E38 E EC H IS] E GR 1L — "1 Ife 
以 及 产物 的 结合 函数 。 
Input countToFourl countToFour2 countToFour3 
2 
E 
5 
(nothing) 
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11-3. 函 数 。 在 这 个 练习 中 ， 我 们 将 实现 max() 和 min() 内 建 函 数 。 


(a) 写 分 别 带 两 个 元 素 返 回 一 个 较 大 和 较 小 元 素 ， 简 单 的 max2() 核 min2() 函 数 。 他 们 应 
该 可 以 用 任意 的 python 对 象 运作 。 举 例 来 说 ，max2 (4,8) 和 min2 (4,8) 会 各 自 每 次 
返回 8 和 4 。 


(b) 创建 使 用 了 在 a 部 分 中 的 解 来 重 构 max() 和 min() 的 新 函数 my_max() 和 my_min()。 这 
些 函 数 分 别 返 回 非 空 队列 中 一 个 最 大 和 最 小 值 。 它 们 也 能 带 一 个 参数 集合 作为 输入 。 用 
数字 和 字符 串 来 测试 你 的 解 。 


11-4. 返 回 值 。 给 你 在 5-13 的 解 创 建 一 个 补充 函数 。 创 建 一 个 以 分 为 单位 的 总 时 间 ， 以 及 
返回 一 个 以 小 时 和 分 为 单位 的 等 价 的 总 时 间 。 


11-5. 默 认 参 数 。 更 新 你 在 练习 5-7 中 创建 的 销售 税 脚本 以 便 让 销售 税率 不 再 是 函数 输入 的 
必要 之 物 。 创 建 使 用 你 地 方 税率 的 默认 参数 如 果 在 调用 的 时 候 没 有 值 传 入 。 


11-6. 变 长 参数 。 下 一 个 称 为 printf() 的 函数 。 有 一 个 值 参数 ， 格 式 字符 串 。 剩 下 的 就 是 根 
据 格 式 化 字符 串 上 的 值 ， 要 显示 在 标准 输出 上 的 可 变 参 数 ， 格 式 化 字符 串 中 的 值 允 许 特 
别 的 字符 串 格式 操作 指示 符 ， 如 %d, %f, etc。 提 示 : 解 是 很 琐碎 的 一 无需 实现 字符 串 
操作 符 功 能 性 ， 但 你 需要 显示 用 字符 串 格 式 化 操作 (%) 。 


11-7. 用 map() 进 行 函 数 式 编程 。 给 定 一 对 同一 大 小 的 列表 ， 如 [1,2,3] 和 ['abc',"def,'ghi， 
..， 将 两 个 标 归并 为 一 个 由 每 个 列表 元 素 组 成 的 元 组 的 单一 的 表 ， 以 使 我 们 的 结果 看 起 
来 像 这 样 : {[ (1 和 abc) , (2/def) , (3,ghi) ,...]。 (虽然 这 问题 在 本 质 上 和 第 6 章 的 
一 个 问题 相似 ， 那 时 两 个 解 没有 直接 的 联系 ) 然后 创建 用 zip 内 建 函 数 创建 另 一 个 解 。 


11-8. 用 filer() 进 行 函数 式 编程 。 使 用 练习 5-4 你 给 出 的 代码 来 决定 疾 年 。 更 新 你 的 代码 一 
边 他 成 为 一 个 函数 如 果 你 还 没有 那么 做 的 话 。 然 后 写 一 段 代 码 来 给 出 一 个 年 份 的 列表 并 
返回 一 个 只 有 周年 的 列表 。 然 后 将 它 转化 为 用 列表 解析 。 


11-9. 用 reduce() 进 行 函 数 式 编程 。 复 习 11.7.2 部 分 ， 益 述 如 何 用 reduce() 数 字 集 合 的 累加 
的 代码 。 修 改 它 ， 创 建 一 个 叫 average() 的 函数 来 计算 每 个 数字 集合 的 简单 的 平均 值 。 
11-10. 用 filter() 进 行 隐 数 式 编程 。 在 unix 文 件 系 统 中 ， 在 每 个 文件 夹 或 者 目录 中 都 有 两 个 


特别 的 文件 : “表示 现在 的 目录 ，… 表 示人 日 录 给 出 上 面 的 知识 * 看 一 下 os istdiro i 
数 的 文档 并 描述 这 段 代码 做 了 什么 


files = filter (lambda x: x and x[0] != '.', os. listdir (folder) ) 


11-11. 用 map() 进 行 函数 式 编程 。 写 一 个 使 用 文件 名 以 及 通过 除去 每 行 中 所 有 排头 和 最 尾 
tn 在 原始 文件 中 读 取 然后 写 入 一 个 新 的 文件 ， 创 建 一 个 新 的 或 者 徐 盖 
掉 已 存在 的 。 给 你 的 用 户 一 个 选择 来 决定 执行 哪 一 个 。 将 你 的 解 转 换 成 使 用 列表 解析 。 


11-12. 传 递 函 数 。 给 在 这 章 中 描述 的 testit() 元 数 写 一 个 姊妹 函数 。timeit() 会 带 一 个 函数 对 
象 (和 参数 一 起 ) 并 计算 出 用 了 多 少时 间 来 执行 这 个 函数 ， 而 不 是 测试 执行 时 的 错误 。 
返回 下 面 的 状态 : 函数 返回 值 、 消 耗 的 时 间 。 你 可 以 用 time. clock() 或 者 time. time()， 无 
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论 哪 一 个 给 你 提供 了 较 高 的 精度 (一般 的 共识 是 在 POSIX 上 用 time. time() ， 在 win32 系 统 
上 用 time. clock()) 注意 : timeit() 亟 数 与 timeit 模 块 不 相关 (在 python2.3 中 引入 ) ° 


11-13. 使 用 reduce() 进 行 函数 式 编程 以 及 递归 。 在 第 8 张 中 ， 我 们 看 到 N 的 阶乘 或 者 N 作 为 
从 1 到 N 所 有 数字 的 乘积 。 

(a) 用 一 分 钟 写 一 个 带 x, y 并 返回 他 们 乘积 的 名 为 mult (x, y) 的 简单 小 巧 的 函 

数 。 

(b) Miktat &ls&mult() £t v X reduces Tt JE R o 

(c) 彻底 抛弃 掉 mult() 的 使 用 ， 用 lamda 表 达 式 替代 。 

(d) 在 这 章 中 ， 我 们 描绘 了 一 个 递归 解决 方案 来 找到 N ! 用 你 在 上 面 问题 中 完成 的 

timeit() 函 数 ， 并 给 三 个 版 本 阶乘 函数 计时 (和 迭代 的 、reduce() 和 递 具 ) o 
11-14.* 递 归 。 我 们 也 来 看 下 在 第 8 章 中 的 裴 波 纳 损 数字 。 重 写 你 先前 计算 斐 波 纳 契 数字 的 
解 (练习 8-9) 以 便 你 可 以 使 用 递归 。 
11-15.* 北 归 。 从 写 练习 6-5 的 解 ， 用 递归 向 后 打印 一 个 字符 串 。 用 递归 向 前 以 及 向 后 打印 
一 个 字符 串 。 


11-16. 更 新 easyMath.py。 这 个 脚本 ， 如 例子 11. 1 描绘 的 那样 ， 以 入 门 程序 来 帮助 年 轻 人 
强化 他 们 的 数学 技能 。 通 过 加 入 乘法 作为 可 支持 的 操作 来 更 进一步 提升 这 个 程序 。 额 外 
的 加 分 : 也 加 入 除法 ; 这 比较 难 做 些 因为 你 要 找到 有 效 的 整 型 除数 。 幸 运 的 是 ， 已 经 有 
代码 来 确定 分 子 比 分 母 大 ， 所 以 不 需要 支持 分 数 。 


11-17. 定 义 
(a) 描述 偏 函 数 应 用 和 currying 之 间 的 区 别 。 
(b) 偏 函 数 应 用 和 闭 包 之 问 有 什么 区 别 ? 
(c) 最 后 ， 和 迭代 器 和 生成 器 是 怎么 区 别 开 的 ? 


11-18.* 同 步 化 函数 调用 。 复 习 下 第 6 章 中 当 引 入 浅 找 贝 和 深 找 贝 的 时 候 ， 提 到 的 丈夫 和 妻 
子 情形 (6.20425) 。 他 们 共用 了 一 个 普通 账户 ， 同 时 对 他 们 银行 账户 访问 时 会 发 生 不 
利 影响 。 创 建 一 个 程序 ， 让 调用 改变 账户 收 支 的 函数 必需 同步 。 换 名 话说 ， 在 任意 给 定 
时 刻 只 能 有 个 一 进程 或 者 线程 来 执行 函数 。 一 开始 你 试 着 用 文件 ， 但 是 一 个 真正 的 解决 
方法 是 用 装饰 器 和 在 threading 或 者 mutex 模 块 中 的 同步 指令 。 你 看 看 第 17 章 来 获得 更 多 
的 灵感 。 
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本 章 主题 

e 什么 是 模块 

e 模块 和 文件 

4 命名 空间 

e 导入 模块 

e 导入 模块 属性 

e 模块 内 建 函 数 包 模块 的 其 他 特性 


本 章 将 集中 介绍 Python 模块 和 如 何 把 数据 从 模块 中 导入 到 编程 环境 中 。 同 时 也 会 涉及 包 的 相 
关 概 念 。 模 块 是 用 来 组 织 Python 代码 的 方法 ， 而 包 则 是 用 来 组 织 模块 的 。 本 章 最 后 还 会 讨论 
一 些 与 模块 有 关 的 其 他 方面 的 问题 。 


12.1 1T A REA 


模块 支持 从 人 逻辑 上 组 织 Python 代 码 。 当 代码 量变 得 相当 大 的 时 候 ， 我 们 最 好 把 代码 分 成 一 些 

有 组 织 的 代码 段 ， 前 提 是 保证 它们 的 彼此 交互 。 这 些 代 码 片 段 相 互 间 有 一 定 的 联系 ， 可 能 是 

一 个 包含 数据 成 员 和 方法 的 类 ， 也 可 能 是 一 组 相关 但 彼此 独立 的 操作 函数 。 这 些 代码 段 是 共 

享 的 ， 所 以 Python 允许“ 调 入 "一 个 模块 ， 人 允许 使 用 其 他 模块 的 属性 来 利用 之 前 的 工作 成 果 ， 实 
现代 码 重 用 。 这 个 把 其 他 模块 中 属性 附加 到 你 的 模块 中 的 操作 叫做 导入 (import) 。 那 些 自我 
包含 并 且 有 组 织 的 代码 片段 就 是 模块 (module) 。 


12.2 模块 和 文件 


如 果 说 模块 是 按照 逻辑 来 组 织 Python 代 码 的 方法 ， 那 么 文件 便 是 物理 层 上 组 织 模 块 的 方法 。 
因此 ， 一 个 文件 被 看 作 是 一 个 独立 模块 ， 一 个 模块 也 可 以 被 看 作 是 一 个 文件 。 模 块 的 文件 名 
就 是 模块 的 名 字 加 上 扩展 名 。py。 这 里 我 们 需要 讨论 一 些 关于 模块 文件 结构 的 问题 。 与 其 他 
可 以 导入 类 (class) 的 语言 不 同 ， 在 Python 中 你 导入 的 是 模块 或 模块 属性 。 


12.2.1 模块 名 称 空间 


本 章 的 后 面 会 详细 的 讨论 名 称 空 间 ， 但 从 基本 概念 来 说 ， 一 个 名 称 空间 就 是 一 个 从 名 称 到 对 
象 的 关系 映射 集合 。 我 们 已 经 明确 地 知道 ， 模 块 名 称 是 它们 的 属性 名 称 中 的 一 个 重要 部 分 。 
例如 string 模 块 中 的 atoi() 函 数 就 是 string. atoi) 。 给 定 一 个 模块 名 之 后 ， 只 可 能 有 一 个 模块 被 


导入 到 Python 解释 器 中 ， 所 以 在 不 同 模块 间 不 会 出 现 名 称 交 叉 现 象 ， 所 以 每 个 模块 都 定义 了 
它 自己 的 唯一 的 名 称 空间 。 如 果 我 在 我 自己 的 模块 mymodule 里 创建 了 一 个 atoi() 函 数 ， 那 么 它 
的 名 字 应 该 是 nymodule. atoi()。 所 以 即使 属性 之 间 有 名 称 冲 突 ， 但 它们 的 完整 授权 名 称 

(fully qualified name) 一 一 通过 句点 属性 标识 指定 了 各 自 的 名 称 空间 防止 了 名 称 冲突 的 
发 生 。 





12.2.2 搜索 路 径 和 路 径 搜 索 


模块 的 导入 需要 一 个 叫做 “路 径 搜 索 ” 的 过 程 。 即 在 文件 系统 “预定 义 区 域 " 中 查找 mymodule.py 
文件 (如 果 你 导入 mymodule 的 话 ) 。 这 些 预定 义 区 域 只 不 过 是 你 的 Python 搜索 路 径 的 集合 。 
路 径 搜索 和 搜索 路 径 是 两 个 不 同 的 概念 ， 前 者 是 指 查 找 某 个 文件 的 操作 ， 后 者 是 去 查找 一 组 
目录 。 有 时 候 导 入 模块 操作 会 失败 : 
>>> import xxx 
Traceback (innermost last): 
File "«interactive input»", line 1, in ? 
ImportError: No module named xxx 
发 生 这 样 的 错误 时 ， 解 释 器 会 告诉 你 它 无 法 访问 请 求 的 模块 ， 可 能 的 原因 是 模块 不 在 搜索 路 
径 里 ， 从 而 导致 了 路 径 搜索 的 失败 。 
默认 搜索 路 径 是 在 编译 或 是 安装 时 指定 的 。 它 可 以 在 一 个 或 两 个 地 方 修改 。 
一 个 是 启动 Python 的 shell 或 命令 行 的 PYTHONPATH 环 境 变量 。 该 变量 的 内 容 是 一 组 用 冒号 分 


4 
割 的 目录 路 径 。 如 果 你 想 让 解释 器 使 用 这 个 变量 ， 那 么 请 确保 在 启动 解释 器 或 执行 Python 脚 
本 前 设置 或 修改 了 该 变量 。 

解释 器 启动 之 后 ， 也 可 以 访问 这 个 搜索 路 径 ， 它 会 被 保存 在 sys 模 块 的 sys. path 变 量 里 。 不 过 
它 已 经 不 是 冒号 分 割 的 字符 串 ， 而 是 包含 每 个 独立 路 径 的 列表 。 下 面 是 一 个 Unix 机 器 搜索 路 
径 的 样 例 。 切 记 ， 搜 索 路 径 在 不 同系 统 下 一 般 是 不 同 的 。 


"Y 


Ssite-r 


m d 


只 是 个 列表 ， 所 以 我 们 可 以 随时 随地 对 
而 


它 进 行 修改 。 如 果 你 知道 你 需要 导入 的 模块 是 什 
它 的 路 径 不 在 搜索 路 径 里 ， 那 么 只 需要 


e 
调用 列表 的 append() 方 法 即 可 ， 就 像 这 样 : 


$ 


sys.path.append ('/home/wesc/py/lib') 


修改 完成 后 ， 你 就 可 以 加 载 自己 的 模块 了 。 只 要 这 个 列表 中 的 某 个 目录 包含 这 个 文件 ， 它 就 
会 被 正确 导入 。 当 然 ， 这 个 方法 是 把 目录 追加 在 搜索 路 径 的 尾部 。 如 果 你 有 特殊 需要 ， 那 么 
应 该 使 用 列表 的 insert() 方 法 操作 。 上 面 的 例子 里 ， 我 们 是 在 交互 模式 下 修改 sys. path 的 ， 在 
脚本 程序 中 也 完全 可 以 达到 同样 的 目的 。 这 里 是 使 用 交互 模式 执行 时 遇 到 的 错误 : 


>>> import sys 
2» import mymodule 
Traceback (innermost last): 
File "«stdin»", line 1l, in 


ImportError: No module named mymodule 


>>> sys.path.append(' /home/wesc/py/lib') 
^ SyS.path 
' 


frr -/ aral /la / 
/usr/local/lib/ 


['', '/usr/local/lib/python2.x/', 
python2.x/plat-sunos5', '/usr/local/lib/python2.x/ 

lib-tk', '/usr/local/lib/python2.x/lib-dynload', '/usr/ 
local/lib/python2.x/site-packages', ' /home/wesc/py/1lib'] 


>>> 


> import mymodule 


从 另 一 方面 看 ， 你 可 能 有 一 个 模块 的 很 多 措 贝 。 这 时 ， 解 释 器 会 使 用 沿 搜索 路 径 顺序 找到 的 
第 一 个 模块 。 


使 用 sys.modules 可 以 找到 当前 导入 了 哪些 模块 和 它们 来 自 什 么 地 方 。 和 sys.path 不 同 ， 
sys.modules 是 一 个 字典 ， 使 用 模块 名 作为 键 (key) ， 对 应 物理 地 址 作为 值 (value) ° 


12.3 ”名称 空间 


名 称 空间 是 名 称 (标识 符 ) 到 对 象 的 映射 。 向 名 称 空间 添加 名 称 的 操作 过 程 涉及 绑 定 标识 符 
到 指定 对 象 的 操作 (以 及 给 该 对 象 的 引用 计数 加 1) 。《Python 语 言 参考 手册 》 (Python 
Language Reference) 有 如 下 的 定义 ; 改变 一 个 名 字 的 绑 定 叫做 重新 绑 定 ， 删 除 一 个 名 字 叫 
做 解除 绑 定 。 


我 们 在 第 11 章 已 经 介绍 过 在 执行 期 间 有 两 个 或 三 个 活动 的 名 称 空间 。 这 三 个 名 称 空间 分 别 是 
局 部 名 称 空间 ， 全 局 名 称 室 间 和 内 建 名 称 空间， 但 局 部 名 称 空间 在 执行 期 间 是 不 断 变化 的 ， 
所 以 我 们 说 “两 个 或 三 个 "。 从 名 称 空 间 中 访问 这 些 名 字 依 赖 于 它们 的 加 载 顺序 ， 或 是 系统 加 载 
这 些 名 称 空间 的 顺序 。 

Python 解释 器 首先 加 载 内 建 名 称 空 间 。 它 由 builins 模 块 中 的 名 字 构 成 。 随 后 加 载 执行 模块 的 
全 局 名 称 空间 ， 它 会 在 模块 开始 执行 后 变 为 活动 名 称 空间 。 这 样 我 们 就 有 了 两 个 活动 的 名 称 


空间 。 


核心 笔记 : —builtins 和  builtin — 





. builtins 模块 和 _builtin ”模块 不 能 混淆 。 虽 然 它 们 的 名 字 相 似 尤其 对 于 新 手 来 说 。 
. builtins — 模块 包含 内 建 名 称 空间 中 内 建 名 字 的 集合 。 其 中 大 多 数 (如 果 不 是 全 部 的 话 ) 来 
自 _builtin_ 模块， 该 模块 包含 内 建 函 数 ， 异 常 以 及 其 他 属性 。 在 标准 Python 执行 环境 下 ， 
. builtins ”包含 ”builtin 的 所 有 名 字 。Python 曾 经 有 一 个 限制 执行 模式 ， 允 许 你 修改 
builins  ， 只 保留 来 自 builtin _ 的 一 部 分 ， 创 建 一 个 沙 金 (sandbox) 环境 。 但 是 ， 因 
为 它 有 一 定 的 安全 缺陷 ， 而 且 修 复 它 很 困难 ，Python 已 经 不 再 支持 限制 执行 模式 。 (如 版 本 
2.3) 
如 果 在 执行 期 间 调用 了 一 个 函数 ， 那 么 将 创建 出 第 三 个 名 称 空间 ， 即 局 部 名 称 空 间 。 我 们 可 
以 通过 igoa PocasQ AA 断 出 某 一 名 字 属 于 哪个 名 称 空间 。 我 们 将 在 本 章 后 面 详 


细 介 绍 这 两 个 函数 。 


12.3.1 名 称 空间 与 变量 作用 域 比 较 
好 了 ， 我 们 已 经 知道 了 什么 是 名 称 空间 ， 那 么 量 作用 域 有 什么 关系 呢 ? 它们 看 起 来 极 
其 相似 ， 事 实 上 也 确实 如 此 。 


名 称 空间 是 纯粹 意义 上 的 名 字 和 对 象 间 的 映射 关系 ， 而 作用 域 还 指出 了 从 用 户 代码 的 哪些 物 
理 位 置 可 以 访问 到 这 些 名 字 。 图 12-1 展 示 了 名 称 空间 和 变量 作用 域 的 关系 。 





Built-ins 

A A 

| Namespaces | 

| | 

图 12-1 名 称 空 间 和 变量 作用 域 
注意 每 个 名 称 空间 是 一 个 自我 包含 的 单元 。 但 从 作用 域 的 观点 来 看 ， 事 情 是 不 同 的 。 所 有 局 
部 名 称 空间 的 名 称 都 在 局 部 作用 范围 内 。 局 部 作用 范围 以 外 的 所 有 名 称 都 在 全 局 作用 范围 
内 。 


还 要 记得 在 程序 执行 过 程 中 ， 局 部 名 称 空间 和 作用 域 会 随 函 数 调 用 而 不 断 变化 ， 而 全 局 名 称 
空间 是 不 变 的 。 


N 


ža TE 340m EA ARAA Ar A A ARA CAA T” o xx E T R 
候 想 想 “ 我 能 看 见 它 吗 ?” 


12.3.2 ZER ` SEGETES E 


么 确定 作用 域 的 规则 是 如 何 联系 到 名 称 空 间 的 呢 ? 它 所 要 做 的 就 是 名 称 查询 。 访 问 一 个 属 
e 解释 器 必须 在 三 个 名 称 空间 中 的 一 个 找到 它 。 首 先 从 局 部 名 称 空间 开始 ， 如 果 没 有 找 
到 ， 解 释 器 将 继续 查找 全 局 名 称 空间 。 如 果 这 也 失败 了 ， 它 将 在 内 建 名 称 空 间 里 查找 。 如 果 
最 后 的 尝试 也 失败 了 ， 你 会 得 到 这 样 的 错误 : 


2»» foo 

Traceback (innermost last): 
Fila "«stdins". line l; inm 2 

NameError: foo 


这 个 错误 信息 体现 了 先 查 找 的 名 称 空 间 是 如 何 "遮蔽 "其 他 后 搜索 的 名 称 空 间 的 。 这 体现 了 名 称 
禾 盖 的 影响 。 图 12-1 的 灰 盒 子 展 示 了 遮蔽 效应 。 例 如 ， 局 部 名 称 空间 中 找到 的 名 字 会 隐藏 全 

局 或 内 建 名 称 空间 的 对 应 对 象 。 这 就 相当 于 "“ 复 盖 ” 了 那个 全 局 变量 。 请 参阅 前 面 章节 引入 的 这 
几 行 代码 : 


def foo(): 
print "WMncalling foo(). 


bar = 200 

print "1n fOóo(), Dar 1s", bat 
bar - 100 
print "i15 _ main p Dur I8", Dar 
foo () 


执行 代码 ， 我 们 将 得 到 这 样 的 输出 : 


in |. main. , bar is 100 
calling fooí)... 


in foots bar is 200 


foo() & ZU 3E fk IR] € bar ER ss T e bar € » &/Abar£r T & ELE rx s 
44. - 8 Zt ARE] 09] ZEE] TUE FRE TR] LBS ARA ^ ARa T AUR ARAS o XT TER € 5 A 
容 请 参阅 第 11.8 节 。 


12.3.3 无 限制 的 名 称 空间 

Python 的 一 个 有 用 的 特性 在 于 你 可 以 在 任何 需要 放置 数据 的 地 方 获得 一 个 名 称 空间 。 我 们 已 
经 在 前 一 章 见 到 了 这 一 特性 ， 你 可 以 在 任何 时 候 给 函数 添加 属性 〈 使 用 熟悉 的 句点 属性 标 
R) 。 


def foo(): 
pass 
foo. doc  - 'Oops, forgot to add doc str above!' 


foo.version = 0.2 


在 本 章 ， 我 们 展示 了 模块 是 如 何 创 建 名 称 空 间 的 ， 你 也 可 以 使 用 相同 的 方法 访问 它们 : 
mymodule.foo() 
mymodule.version 


虽然 我 们 还 没 介绍 面向 对 象 编程 (OOP， 将 在 第 13 章 介绍 ) ， 但 我 们 可 以 看 看 一 个 简单 
的 “Hello World!" 4| F : 


class MyUltimatePythonStorageDevice (object) 
pass 

bag = MyUltimatePythonStorageDevice() 

bag.x - 100 

bag.y 200 


bag.version = 0.1 


bag.completed = False 


你 可 以 把 任何 想 要 的 东西 放 入 一 个 名 称 空间 里 。 像 这 样 使 用 一 个 类 (实例 ) 是 很 好 的 ， 你 其 
至 不 需要 知道 一 些 关 于 OOP 的 知识 ( 注 : 类 似 这 样 的 变量 叫做 实例 属性 ) 。 不 管 名 字 如 何 ， 
这 个 实例 只 是 被 用 做 一 个 名 称 空 间 。 

随 着 学 习 的 深入 ， 你 会 发 现 OOP 是 多 么 地 有 用 ， 上 比如 在 运行 时 临时 (而 且 重 要 ) 变量 的 时 
ik | 正如 在 《Zen of Python》 中 陈述 的 最 后 一 条 ，“ 名 称 空间 是 一 个 响亮 的 杰出 创意 那 就 
让 我 们 多 用 用 它们 吧 1 ”( 在 交互 模式 解释 器 下 导入 this 模 块 就 可 以 看 到 完整 的 《Zen》) 。 





12.4 导入 模块 


12.4.1 import% 4] 


使 用 import 语 句 导 入 模块 ， 它 的 语法 如 下 所 示 : 


import modulel 
import module2[ 
import moduleN 


也 可 以 在 一 行内 导入 多 个 模块 ， 像 这 样 .… 


import modulel[,; module2[,... moduleN]] 


但 是 这 样 的 代码 可 读 性 不 如 多 行 的 导入 语句 。 而 且 在 性 能 上 和 生成 Python 字 节 代码 时 这 两 种 
做 法 没有 什么 不 同 。 所 以 一 般 情 况 下 ， 我 们 使 用 第 一 种 格式 。 





核心 风格 : import 语 句 的 模块 顺序 
我 们 推荐 所 有 的 模块 在 Python 模块 的 开头 部 分 导入 。 而 且 最 好 按照 这 样 的 顺序 : 
。 Python 标准 库 模 块 
e Python 第 三 方 模块 
e 应 用 程序 自 定 义 模 块 


然后 使 用 一 个 空 行 分 割 这 三 类 模块 的 导入 语句 。 这 将 确保 模块 使 用 固定 的 习惯 导入 ， 有 助 于 
减少 每 个 模块 需要 的 import 语 名 数目 。 其 他 的 提示 请 参考 "Python's Style Guide", PEP8 。 


解释 器 执行 到 这 条 语句 ， 如 果 在 搜索 路 径 中 找到 了 指定 的 模块 ， 就 会 加 载 它 。 该 过 程 遵循 作 
用 域 原则 ， 如 果 在 一 个 模块 的 顶层 导入 ， 那 么 它 的 作用 域 就 是 全 局 的 ; 如 果 在 函数 中 导入 ， 
那么 它 的 作用 域 是 局 部 的 。 

如 果 模 块 是 被 第 一 次 导入 ， 它 将 被 加 载 并 执行 。 

12.4.2 from-importiž 4 


你 可 以 在 你 的 模块 里 导入 指定 的 模块 属性 。 也 就 是 把 指定 名 称 导 入 到 当前 作用 域 。 使 用 from- 
import 语 句 可 以 实现 我 们 的 目的 ， 它 的 语法 是 : 


from module import namel[, name2[,... nameN]] 


12.4.3 多 行 导 入 


多 行 导入 特性 是 Python 2.4 为 较 长 的 from-import 提 供 的 。 从 一 个 模块 导入 许多 属性 时 ，import 
行 会 越 来 越 长 ， 直 到 自动 换行 ， 而 且 需 要 一 个 。 下 面 是 PEP 328 提 供 的 样 例 代 码 : 


from Tkinter import Tk, Frame, Button, Entry, Canvas, \ 


Text, LEFT, DISABLED, NORMAL, RIDGE, END 


你 可 以 选择 使 用 多 行 的 ffrom-import 语 句 : 


from Tkinter import Tk, Frame, Button, Entry, Canvas, Text 


from Tkinter import LEFT, DISABLED, NORMAL, RIDGE, END 


我 们 不 提倡 使 用 不 再 流行 的 fom Tkinter import 4j (412. 5. 3 小 节 的 “核心 风格 ") 9 
正 的 Python 程序 员 应 该 使 用 Python 的 标准 分 组 机 制 ( 圆 括号 ) 来 创建 更 合理 的 多 行 导 入 语 
4 : 


from Tkinter import (Tk, Frame, Button, Entry, Canvas, Text, LEFT, DISABLED, NORMAL, RIDGE, END) 


你 可 以 在 PEP 328 找 到 更 多 关于 多 行 导 入 的 内 容 。 


12.4.4 i /&jimporti$ 4] (as) 


有 时 候 你 导入 的 模块 或 是 模块 属性 名 称 已 经 在 你 的 程序 中 使 用 了 ， 或 者 你 不 想 使 用 导入 的 名 
字 。 可 能 是 它 太 长 不 便 输 入 什么 的 ， 总 之 你 不 喜欢 它 。 这 已 经 成 为 Python 程序 员 的 一 个 普遍 
需求 : 使 用 自己 想 要 的 名 字 替 换 模块 的 原始 名 称 。 一 个 普遍 的 解决 方案 是 把 模块 赋值 给 一 个 


变量 : 
>>> import longmodulename 


>>> short = longmodulename 


>>> del longmodulename 


上 边 的 例子 中 ， 我 们 没有 使 用 longmodulename. attribute ， 而 是 使 用 short. attribute 3 77 1^] 48 
同 的 对 象 (from-imoort 语 名 也 可 以 解决 类 似 的 问题 ， 参 见 下 面 的 例子 ) 。 不 过 在 程序 里 一 遍 
又 一 遍 做 这 样 的 操作 是 很 无 聊 的 。 使 用 扩展 的 import， 你 就 可 以 在 导入 的 同时 指定 局 部 绑 定 名 
称 。 如 下 所 示 。 

import Tkinter 

from cgi import FieldStorage 

可 以 替换 为 
import Tkinter as tk 


from cgi import FieldStorage as form 


Python 2. 0 加 入 了 这 个 特性 。 不 过 那 时 “as” 还 不 是 一 个 关键 字 ; Python 2. 6 正式 把 它 列 为 一 个 
关键 字 。 更 多 关于 扩展 导入 语句 的 内 容 请 参阅 《Python 语 言 参考 手册 》 和 PEP 221。 


12.5 模块 导入 的 特性 


12.5.4 载 入 时 执行 模块 


加 载 模块 会 导致 这 个 模块 被 “执行 "。 也 就 是 被 导入 模块 的 顶层 代码 将 直接 被 执行 。 这 通常 包括 
设 定 全 局 变量 以 及 类 和 函数 的 声明 。 如 果 有 检查 _name _ 的 操作 ， 那 么 它 也 会 被 执行 。 


当然 ， 这 样 的 执行 可 能 不 是 我 们 想 要 的 结果 。 你 应 该 把 尽 可 能 多 的 代码 封装 到 函数 。 明 确 地 
说 ， 只 把 函数 和 模块 定义 放 入 模块 的 顶层 是 良好 的 模块 编程 习惯 。 


更 多 信息 请 参阅 第 14.1.1 节 以 及 相应 的 “核心 笔记 ”。 


Python 加 入 的 一 个 新 特性 允许 你 把 一 个 已 经 安装 的 模块 作为 脚本 执行 。 ( 当然， 执行 你 自己 
的 脚本 很 简单 [$ foo.py]， 但 执行 一 个 标准 库 或 是 第 三 方 包 中 的 模块 需要 一 定 的 技巧 。) 你 可 
以 在 第 14. 4. 3 一 节 中 了 解 更 多 。 


12.5.2 $A (import) 和 加 载 (load) 


一 个 模块 只 被 加 载 一 次 ， 无 论 它 被 导入 多 少 次 。 这 可 以 阻止 多 重 导 入 时 代码 被 多 次 执行 。 例 
如 你 的 模块 导入 了 sys 模 块 ， 而 你 要 导入 的 其 他 5 个 模块 也 导入 了 它 ， 那 么 每 次 都 加 载 sys (或 
是 其 他 模块 ) 不 是 明智 之 举 ! 所以， 加载 只 在 第 一 次 导入 时 发 生 。 


12.5.3 ”导入 到 当前 名 称 空 间 的 名 称 


调用 from-import 可 以 把 名 字 导 入 当前 的 名 称 空间 里 去 ， 这 意味 着 你 不 需要 使 用 属性 /句点 属性 
标识 来 访问 模块 的 标识 符 。 例 如 ， 你 需要 访问 模块 module 中 的 var 名 字 是 这 样 被 导入 的 : 


from module import var 


我 们 使 用 单个 的 var 就 可 以 访问 它 自身 。 把 var 导 入 到 名 称 空间 后 就 再 没 必 要 引用 模块 了 。 当 
然 ， 你 也 可 以 把 指定 模块 的 所 有 名 称 导 入 到 当前 名 称 空间 里 : 


from module import * 





核心 风格 : 限制 使 用 “from module import*" 

在 实践 中 ， 我 们 认为 from module import** 不 是 良好 的 编程 风格 ， 因 为 它 “ 污 染 ” 当 前 名 称 空 
间 ， 而 且 很 可 能 徐 盖 当前 名 称 空间 中 现 有 的 名 字 ; 但 如 果 某 个 模块 有 很 多 要 经 常 访问 的 变量 
或 者 模块 的 名 字 很 长 ， 这 也 不 失 为 一 个 方便 的 好 办 法 。 


我 们 只 在 两 种 场合 下 建议 使 用 这 样 的 方法 ， 一 个 场合 是 : 目标 模块 中 的 属性 非常 多 ， 反 复 键 
入 模块 名 很 不 方便 ， 例 如 Tkinter (Python/Tk) 和 NumPy (Numeric Python) 模块 ， 可 能 还 
有 socket 模 块 。 另 一 个 场合 是 在 交互 解释 器 下 ， 因 为 这 样 可 以 减少 输入 次 数 。 


12.5.4 被 导入 到 导入 者 作用 域 的 名 字 


只 从 模块 导入 名 字 的 另 一 个 副作用 是 那些 名 字 会 成 为 局 部 名 称 空间 的 一 部 分 。 这 可 能 叶 致 履 
盖 一 个 已 经 存在 的 具有 相同 名 字 的 对 象 。 而 且 对 这 些 变量 的 改变 只 影响 它 的 局 部 找 贝 而 不 是 
所 导入 模块 的 原始 名 称 空间 。 也 就 是 说 ， 绪 定 只 是 局 部 的 而 不 是 整个 名 称 空间 。 


这 里 我 们 提供 了 两 个 模块 的 代码 : 一 个 导入 者 ，impter.py 和 一 个 被 导入 者 ，imptee. py. 
impter. py 使 用 from-import 语 句 只 创建 了 局 部 绑 定 。 


Eitzzifiiifiiii: 
# imptee.py # 
uitzit£tzitii 


foo = 'abc' 


def show(): 


print 'foo from imptee:', foo 
EEE FE HEEE E EEE E H 
# impter.py # 
EEFE HEEE HE E E E H HH 
from imptee import foo, show 
show () 
foo = 123 
print 'foo from impter:', Töö 


show ( ) 
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运行 这 个 导入 者 程序 ， 我 们 发 现 从 被 导入 者 的 观点 看 ， 它 的 foo 变 量 没 有 改变 ， 即 使 我 们 在 


importerpy 里 修改 了 它 。 


foo from imptee: abc 
foo from impter: 123 


foo from imptee: abc 
唯一 的 解决 办 法 是 使 用 import 和 完整 的 标识 符 名 称 (句点 属性 标识 ) 。 


EEE EHHH 

# impter.py # 

EEEE HE HE HE TEHE E E H HH 

import imptee 

imptee. show () 

imptee.foo = 123 

print 'foo from impter:', imptee.foo 


imptee.show() 
完成 相应 修改 后 ， 结 果 如 我 们 所 料 : 
foo from imptee: abc 


foo from impter: 123 


foo from imptee: 123 


12.5.5 XT future 


回首 Python 2. 0， 我 们 认识 到 了 由 于 改进 、 新 特性 和 当前 特性 增强 ， 某 些 变化 会 影 


响 到 当前 


功能 。 所 以 为 了 让 Python 程序 员 为 新 事物 做 好 准备 ，Python 实 现 了 future 44$ ° 


使 用 from-import 语 多“ 导入 "新 特性 ， 用 户 可 以 尝试 一 下 新 特性 或 特性 变化 ， 以 便 在 特性 国定 下 
来 的 时 候 修改 程序 。 它 的 语法 是 : 


from  Jfuture . import new feature 


Aimport future ”不 会 有 任何 变化 ， 所 以 这 是 被 禁止 的 (事实 上 这 是 允许 的 ， 但 它 不 会 如 你 
所 想 的 那样 启用 所 有 特性 ) 。 你 必须 显示 地 导入 指定 特性 。 你 可 以 在 PEP 236 找 到 更 多 关于 
_ future 的 资料 。 


12.5.6 IER 


je future 指令 类 似 ， 有 必要 去 警告 用 户 不 要 使 用 一 个 即将 改变 或 不 支持 的 操作 ， 这 样 他 们 
会 在 新 功能 正式 发 布 前 采取 必要 措施 。 这 个 特性 是 很 值得 讨论 的 ， 我 们 这 里 分 步 讲解 一 下 。 


首先 是 应 用 程序 ( 员 ) 接口 (Application programmers' interface, API) 。 程 序 员 应 该 有 从 
Python 程序 〈 通 过 调用 warnings 模 块 ) 或 是 C 中 (通过 PyErr_Warn() 调 用 ) 发 布 警告 的 能 力 。 


这 个 框架 的 另 个 部 分 是 一 些 警 告 异 常 类 的 集合 。Warning 直 接 从 Exception 继 承 ， 作 为 所 有 警 
告 的 基 类 ， 这 些 警告 包括 UserWarning, DeprecationWarning, SyntaxWarning 和 
RuntimeWarning， 都 在 第 10 章 中 有 详细 介绍 。 


另 一 个 组 件 是 警告 过 滤器 ， 由 于 过 滤 有 多 种 级 别 和 严重 性 ， 所 以 警告 的 数量 和 类 型 应 该 是 可 
控制 的 。 警 告 过 滤器 不 仅仅 收集 关于 警告 的 信息 (例如 行 号 、 警 告 原因 等 ) ， 而 且 还 控制 是 
否 忽略 警告 ， 是 否 显示 一 一 可 以 是 自 定 义 的 格式 一 一 或 者 转换 为 错误 〈 生 成 一 个 异常 ) 。 





引发 警告 的 Python 脚本 时 ， 可 以 记录 它 的 输出 记录 到 日 志文 件 中 ， 而 不 是 直接 显示 给 终端 用 
户 。Python 还 提供 了 一 个 可 以 操作 警告 过 滤器 的 APl。 

最 后 ， 命 令 行 也 可 以 控制 敬告 过 滤器 。 你 可 以 在 启动 Python 解释 器 的 时 候 使 用 -W 选 项 。 请 参 
阅 PEP 230 的 文档 获得 你 的 Python 版 本 的 对 应 开关 选项 。Python 2.1 第 一 次 引入 警告 框架 。 


12.5.7 从 ZIP 文 件 中 导入 模块 


在 2. 3 版 中 ，Python 加 入 了 从 ZIP 归 档 文 件 导 入 模块 的 功能 。 如 果 你 的 搜索 路 径 中 存在 一 个 包 
含 Python 模 块 (.py、.pyc 或 。pyo 文 件 ) 的 。zip 文 件 ， 导 入 时 会 把 ZIP 文 件 当 作 目 录 处 理 ， 在 
文件 中 搜索 模块 。 


如 果 要 导入 的 一 个 ZIP 文 件 只 包含 。py 文 件 ， 那 么 Python 不 会 为 其 添加 对 应 的 。pyc 文 件 ， 这 
意味 着 如 果 一 个 ZIP 归 档 没 有 匹配 的 。pyc 文 件 时 ， 导 入 速度 会 相对 慢 一 点 。 


同时 你 也 可 以 为 。zip 文 件 加 入 特定 的 〈 子 ) 目录 ， 例 如 /tmp/yolk. zip/lib 只 会 从 yolk 虹 档 的 lib/ 
子 目录 下 导入 。 虽 然 PEP 273 指 定 了 这 个 特性 ， 但 事实 上 使 用 了 PEP 302 提 供 的 导入 钩子 来 实 
现 它 。 


12.5.8 “新 的 "导入 钩子 


ey 其 实 新 导入 钧 子 (import hook, PEP 302) 的 “第 一 个 顾客 ”。 我们 使 
用 了 "新 "这 个 字 ， 因 为 在 这 之 前 实现 自 定义 导入 器 只 能 是 使 用 一 些 很 十 老 的 模块 ， 它 们 并 不 会 
简化 创 。 另 一 个 解决 方法 是 履 盖 import _()， 但 这 并 不 简单 ， 你 需要 (重新 ) 实现 
整个 导入 机 制 。 


2. 3 引入 的 新 导入 钧 子 ， DENS ue 个 操作 。 你 只 需要 编写 可 调用 的 import 类 ， 然 后 
过 Sys 模块 “注册 ”( 或 者 叫 " 安 装 ”) 它 


你 需要 两 个 类 : 一 个 查找 器 和 一 个 载 入 器 。 这 些 类 的 实例 接受 一 个 参数 : 模块 或 包 

称 。 查 找 器 实例 负责 查找 你 的 模块 ， 如 果 它 找到 ， 那 么 它 将 返回 一 个 载 入 器 对 象 。 查 找 器 

以 接受 一 个 路 径 用 以 查找 子 包 (subpackages) 。 载 入 器 会 把 模块 载 入 到 内 存 。 它 负 
创建 一 个 Python 模 块 所 需要 的 一 切 操 作 ， 然 后 返回 模块 。 


这 些 实例 被 加 入 到 sys. path_hookso.sys.path_importer_cache 只 是 用 来 保存 这 些 实例 ， 这 样 
就 只 需要 访问 path_hooks 一 次 。 最 后 ，sys. meta _path 用 来 保存 一 列 需 要 在 查询 sys. path 之 
前 访问 的 实例 ， 这 些 是 为 那些 已 经 知道 位 置 而 不 需要 查找 的 模块 准备 的 。meta-path 已 经 有 了 


TH 1 
指定 模块 或 包 的 载 入 器 对 象 的 读 取 器 


12.6 HORE AE 


系统 还 为 模块 提供 了 一 些 功能 上 的 支持 ， 现 在 我 们 将 详细 讨论 他 们 。 


12.6.1 — import () 


Python 1. 529 X f import ()éàZk > CA EREZA A o iX XS importi& 4] 38 
7] import (AZ Aeg LE o EDUC T db d AK EY? su: xm 
ELFA * 


. import ()í$38 7A X : 
. import (module name[, globals[, locals[, fromlist]]]) 


module name 变量 是 要 导入 模块 的 名 称 ，globals 是 包含 当前 全 局 符号 表 的 名 字 的 字典 
locals 是 包含 局 部 符号 表 的 名 字 的 字典 ，fromlist 是 一 个 使 用 from-import 语 句 所 导入 pen 的 列 
É 


globals、locals 和 fromlist 参 数 都 是 可 选 的 ， 黑 认 分 别 为 globals() ^ locals()?e[] » 


W A import sys 语 句 可 以 使 用 下 边 的 语句 完成 : 


Sys = import ('sys') 


12.6.2 globals() 和 locals() 


globals() 和 |ocals() 内 建 隐 数 分 别 返 回调 用 者 全 局 和 局 部 名 称 空间 的 字典 。 在 一 个 函数 内 部 ， 
局 部 名 称 空间 代表 在 函数 执行 时 候 定 义 的 所 有 名 字 ，locals() 元 数 返 回 的 就 是 包含 这 些 名 字 的 
字典 。globals() 会 返回 函数 可 访问 的 全 局 名 字 。 
在 全 局 名 称 空间 下 ，globals() 和 locals() 返 回 相 同 的 字典 ， 因 为 这 时 的 局 部 名 称 空间 就 是 全 局 
空间 。 下 边 这 段 代 码 演示 这 两 个 函数 的 了 使 用 : 


def foo(): 

print 'Mncalling foo()...' 

aString = 'bar' 

anInt = 42 

print "foo()'s globals:", globals().keys() 

print "foo()'s locals:", locals().keys() 
print " main 's globals:", globals().keys() 
print " main 's locals:", locals().keys() 


foo() 


我 们 只 在 这 里 访问 了 字典 的 键 ， 因 为 它 的 值 在 这 里 没有 影响 (而 且 他 们 会 让 行 变 得 更 长 更 难 
R) 。 执 行 这 个 脚本 ， 我 们 得 到 如 下 的 输出 : 


S namespaces.py 
.Q,RÁain. 's globais: [' doc. ', 'foo', ' name ', '. builtins.. 
maln 's locale: ['. doo. ', 'fso', ' name “y ' Dulltins '] 
calling foo()... 
' 


foo()*'s globals: [' doc. ', 'foo', ' mnamée 177 ' builtins "' 


foo()'s locals: ['anInt', 'aString'] 


12.6.3 reload() 


reload() A E RAT VA d A — 4 C22 SACRE o CEAT : 


reload (module) 


module 是 你 想 要 重新 导入 的 模块 。 使 用 reload() 的 时 候 有 一 些 标准 。 首 先 模块 必须 是 全 部 导入 
(不 是 使 用 from-import) ， 而 且 它 必须 被 成 功 导 入 。 另 外 reload() 有 函数 的 参数 必须 是 模块 自身 
而 不 是 包含 模块 名 的 字符 串 。 也 就 是 说 必须 类 似 reload (sys) 而 不 是 reload (‘sys’) ° 


模块 中 的 代码 在 导入 时 被 执行 ， 但 只 执行 一 次 。 以 后 执行 Import 语句 不 会 再 次 执行 这 些 代码 ， 
只 是 绑 定 模块 名 称 。 而 reload() 函 数 不 同 。 


12.7 & 

包 是 一 个 有 层次 的 文件 目录 结构 ， 它 定义 了 一 个 由 模块 和 子 包 组 成 的 Python 应 用 程序 执行 环 
境 。Python 1. 5 加 入 了 包 ， 用 来 帮助 解决 如 下 问题 : 

e 为 平坦 的 名 称 空间 加 入 有 层次 的 组 织 结构 ; 

e 允许 程序 员 把 有 联系 的 模块 组 合 到 一 起 ; 

e 允许 分 发 者 使 用 目录 结构 而 不 是 一 大 堆 混 乱 的 文件 ; 

e 帮助 解决 有 冲突 的 模块 名 称 。 

与 类 和 模块 相同 ， 包 也 使 用 句点 属性 标识 来 访问 他 们 的 元 素 。 使 用 标准 的 import 和 from-import 
语句 导入 包 中 的 模块 。 

12.7.1 目录 结构 


假定 我 们 的 包 的 例子 有 如 下 的 目录 结构 : 


二 版 
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Phone/ 

Et .py 

common util.py 

Voicedta/ 
.Ahit .Dy 
Pots.py 
Isdn.py 

Fax/ 
sibi Dy 
G3.py 

Mobile/ 
-nL py 
Analog.py 
Digital.py 

Pager/ 
Aat Dy 


Numeric.py 
Phone 是 最 顶层 的 包 ，Voicedta 等 是 它 的 子 包 。 我 们 可 以 这 样 导 入 子 包 : 
import Phone.Mobile.Analog 
Phone.Mobile.Analog.dial() 


你 也 可 使 用 from-import 实 现 不 同 需求 的 导入 。 


第 一 种 方法 是 只 导入 顶层 的 子 包 ， 然 后 使 用 属性 /点 操作 符 向 下 引用 子 包 树 : 
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from Phone import Mobile 


Mobile.Analog.dial('555-1212') 


此 外 ， 我 们 可 以 还 引用 更 多 的 子 包 


from Phone.Mobile import Analog 
Analog.dial('555-1212"') 


事实 上 ， 你 可 以 一 直 沿 子 包 的 树 状 结构 导入 : 


from Phone.Mobile.Analog import dial 
dialí('555-1212') 


在 我 们 上 边 的 目录 结构 中 ， 我 们 可 以 发 现 很 多 的 ”init .py 文件 。 这 些 是 初始 化 模块 ，from- 
import 语 名 导入 子 包 时 需要 用 到 它 。 如 果 没 有 用 到 ， 他 们 可 以 是 空 文件 。 程 序 员 经 党 忘记 为 它 
们 的 包 目 录 加 入 init .py 文件 ， 所 以 从 Python 2. 5 开始 ， 这 a 
É, o 


A 


不 过 ， 除 非 给 解释 器 传递 了 -Wd 选项 ， 否 则 它 会 被 简单 地 忽略 。 


12.7.2 使 用 from-import 导 入 包 


包 同 样 支持 fom-import alli& 47. : 


from package.module import * 


然而 ， 人 系统 的 文件 系统 。 所 以 我 们 在 _init .py 中 加 入 
al 变量。 该 变量 包含 执行 这 样 的 语句 时 应 该 导入 的 模块 的 名 字 ， 它 由 一 个 模块 名 字符 串 
列表 组 成 。 


12.7.2.1 绝对 导入 


包 的 使 用 越 来 越 广泛 ， 很 多 情况 下 导入 子 包 会 导致 和 费 正 的 标准 库 模 块 发 生 (事实 上 是 它们 
的 名 字 ) 冲突 。 包 模块 会 把 名 字 相 同 的 标准 库 模块 隐藏 挤 ， 因 为 它 首先 在 包 内 执行 相对 导 
入 ， 隐 藏 掉 标 准 库 模块 。 


为 此 ， 所 有 的 导入 现在 都 被 认为 是 绝对 的 ， 也 就 是 说 这 些 名 字 必 须 通 过 Python 路 径 (sys. 
path 或 是 PYTHONPATH ) 来 访问 。 


这 个 决定 的 基本 原理 是 子 包 也 可 以 通过 sys. path 访 问 ， 例 如 import Phone. Mobile. Analog ° 
在 这 个 变化 之 前 ， 从 Mobile 子 包 内 模块 中 导入 Analog 是 合理 的 。 作 为 一 个 折 中 方案 ，Python 
允许 通过 在 模块 或 包 名 称 前 置 句 点 实现 相对 导入 。 更 多 信息 请 参阅 第 12.7.4 节 。 


从 Python 2. 7 开始 ， 绝 对 导入 特性 将 成 为 默认 功能 (从 Python 2. 5 开始 ， 你 可 以 从 _ future _ 
导入 absolute_import， 体 验 这 个 功能 ) 。 你 可 以 参阅 PEP 328 了 解 更 多 相关 内 容 。 


12.7.2.2 相对 导入 


如 前 所 述 ， 绝 对 导入 特性 限制 了 模块 作者 的 一 些 特权 。 失 去 了 import 语 句 的 自由 ， 必 须 有 新 的 
特性 来 满足 程序 员 的 需求 。 这 时 候 ， 我 们 有 了 相对 导入 。 相 对 导入 特性 稍微 地 改变 了 import 语 
法 ， 让 程序 员 告 诉 导 入 者 在 子 包 的 哪里 查找 某 个 模块 。 因 为 import 语 名 总 是 绝对 导入 的 ， 所 以 
相对 导入 只 应 用 于 from-import 语 名。 


语法 的 第 一 部 分 是 一 个 名 点， 指示 一 个 相对 的 导入 操作 。 之 后 的 其 他 附加 句点 代表 当前 from 
起 始 查 找 位 置 后 的 一 个 级 别 。 


我 们 再 来 看 看 上 边 的 例子 。 在 Analog. Mobile. Digital， 也 就 是 Digital.py 模 块 中 ， 我 们 不 能 简 
单 地 使 用 这 样 的 语法 。 下 边 的 代码 只 能 工作 在 旧版 本 的 Python 下 ， 在 新 的 版 本 中 它 会 导致 一 
个 敬告， 或 者 干脆 不 能 工作 : 


import Analog 


from Analog import dial 


这 是 绝对 导入 的 限制 造成 的 。 你 需要 在 使 用 绝对 导入 或 是 相对 导入 中 做 出 选择 。 下 边 是 一 些 
可 行 的 导入 方法 : 


from Phone.Mobile.Analog import dial 


from .Analog import dial 


from ..common util import setup 


from ..Fax import G3.dial. 


从 2.5 版 开始 ， 相 对 导入 被 加 入 到 了 Python 中 。 在 Python 2.6 中 ， 在 模块 内 部 的 导入 如 果 没 有 
使 用 相对 导入 ， 那 么 会 显示 一 个 警告 信息 。 你 可 以 在 PEP 328 的 文档 中 获得 更 多 相关 信息 。 


12.8 ”模块 的 其 他 特性 


12.8.1 自动 载 入 的 模块 


当 Python 解 释 器 在 标准 模式 下 启动 时 ， 一 些 模块 会 被 解释 器 自动 导入 ， 用 于 系统 相关 操作 。 
唯一 一 个 影响 你 的 是 ”builtin “模块 ， 它 会 正常 地 被 载 入 ， 这 和 builtins “模块 相同 。 


sys.modules 变 量 包 含 一 个 由 当前 载 入 (完整 且 成 功 导 入 ) 到 解释 器 的 模块 组 成 的 字典 ， 模 块 
名 作为 键 ， 它 们 的 位 置 作 为 值 。 


例如 在 Windows 下 ，sys.modules 变 量 包含 大 量 载 入 的 模块 ， 我 们 这 里 截 短 它 ， 只 提供 他 们 的 
模块 名 ， 通 过 调用 字典 的 keys() 方 法 : 


>>> import sys 

>>> sys.modules.keys() 
(*os.path', 'os', 'exceptions', ' gain ', 'ntpath', 
USCrOD', *nt', "sus", ' Iurlbtipn..', "'site', 


'signal', 'UserDict', "'string', 'stat'] 
Unix 下 载 入 的 模块 很 类 似 : 


>>> import sys 
>>> sys.modules.keys() 
['os.path', 'os', 'readline', 'exceptions', 


' ' 


Main ', 'posix', "Sya. . Builtin  ',., "'site', 


'signal', 'UserDict', 'posixpath', 'stat'] 


12.8.2 ”阻止 属性 导入 


如 果 你 不 想 让 某 个 模块 属性 被 from module import*” 导 入 ， 那 么 你 可 以 给 你 不 想 导 入 的 属性 名 
称 加 上 一 个 下 划 线 (_) 。 不 过 如 果 你 导入 了 整个 模块 或 是 你 显 式 地 导入 某 个 属性 〈 例 如 
importfoo. bar) ， 这 个 隐藏 数据 的 方法 就 不 起 作用 了 。 


12.8.8 不 区 分 大 小 的 导入 


有 一 些 操作 系统 的 文件 系统 是 不 区 分 大 小 写 的 。Python 2. 1 前 ，Python 尝 试 在 不 同 平台 下 导 
入 模块 时 候 "做 正确 的 事情 "， 但 随 着 MacOSX 和 Cygwin 平 台 的 流行 ， 这 样 的 不 足 已 经 不 能 再 
被 忽视 ， 而 需要 被 清除 。 


在 Unix (区 分 大 小 写 ) 和 Win32 (不 区 分 大 小 写 ) 下， 一切 都 很 明了 ， 但 那些 新 的 不 区 分 大 小 
写 的 系统 不 会 被 加 入 区 分 大 小 写 的 特性 。PEP 235 指 定 了 这 个 特性 ， 尝 试 解决 这 个 问题 ， 并 避 
免 那 些 其 他 系统 上 “hack” 式 的 解决 方法 。 底 线 就 是 为 了 让 不 区 分 大 小 写 的 导入 正常 工作 ， 必 须 
指定 一 个 叫做 PYTHONCASEOK 的 环境 变量 。Python 会 导入 第 一 个 匹配 模块 名 〈 使 用 不 区 分 
大 小 写 的 习惯 ) 。 和 否则 Python 会 执行 它 的 原生 区 分 大 小 写 的 模块 名 称 匹配 ， 导 入 第 一 个 匹配 
的 模块 。 


12.8.4” 源 代码 编码 


从 Python 2.3 开 始 ，Python 的 模块 文件 开始 支持 除 7 位 ASCIl 之 外 的 其 他 编码 。 当 然 ASCll 是 默 
认 的 ， 你 只 要 在 你 的 Python 模 块头 部 加 入 一 个 额外 的 编码 指示 说 明 就 可 以 让 导入 者 使 用 指定 
的 编码 解析 你 的 模块 ， 编 码 对 应 的 Unicode 字 符 串 。 所 以 你 使 用 纯 ASCII 文 本 编辑 器 的 时 候 不 
需要 担心 了 (不 需要 把 你 的 字符 串 放 入 “Unicode 标 签 " 里 ) 。 


一 个 UTF-8 编 码 的 文件 可 以 这 样 指示 : 


K'/usr/bin/env python 
f -=*= puding; UTF-8 -*- 


如 果 你 执行 或 导入 了 包含 非 ASCII 的 Unicode 字 符 串 而 没有 在 文件 头 部 说 明 ， 那 么 你 会 在 
Python 2. 3 得 到 一 个 DeprecationWaming ， 而 在 2. 5 中 这 样 做 会 导致 语法 错误 。 你 可 以 在 PEP 
263 中 得 到 更 多 关于 源 文件 编码 的 相关 内 容 。 


12.8.5 “导入 循环 


实际 上 ， 在 使 用 Python 时 ， 你 会 发 现 是 能 够 导入 循环 的 。 如 果 你 开发 了 大 型 的 Python 工程 ， 
那么 你 很 可 能 会 陷入 这 样 的 境地 。 


我 们 来 看 一 个 例子 。 假 定 我 们 的 产品 有 一 个 很 复杂 的 命令 行 接口 (command-line interface， 

CLI) 。 其 中 将 会 有 超过 一 百 万 的 命令 ， 结 果 你 就 有 了 一 个 “ 超 宛 余 处 理 器 ”(overly massive 
handler, OMH) 子 集 。 每 加 入 一 个 新 特性 ， 将 有 1 一 3 条 的 新 命令 加 入 ， 用 于 支持 新 的 特性 。 
下 边 是 我 们 的 omh4cli.py 脚 本 : 


from cli4vof import cli4vof 
# command line interface utility function 
def cli util(): 
pass 
# overly massive handlers for the command line interface 


def omhá4cli(0): 
cli4vof() 


omhácli() 


假定 大 多 控制 器 都 要 用 到 这 里 的 (其实 是 空 的 ) 工具 函数 。 命令 行 接口 的 OMH 都 被 封装 
pA 如 果 我 们 要 添加 一 个 新 的 命令 ， 那 么 它 会 被 调用 。 


现在 这 个 模块 不 断 地 增长 ， 一 些 聪明 的 工程 师 会 决定 把 新 命令 放 入 到 隔离 的 模块 里 ， 在 原始 
模块 中 只 提供 访问 新 东西 的 钧 子 。 这 样 ， 管 理 代码 会 变 得 更 简单 ， 如 果 在 新 加 入 内 容 中 发 现 
了 bug， 那 么 你 就 不 必 在 一 个 几 兆 的 Python 文件 里 搜索 。 


在 我 们 的 例子 中 ， 有 一 个 兴奋 的 经 理 要 我 们 加 入 一 个 “非常 好 的 特性 ”。 我 们 将 创建 一 个 新 的 
cli4vof.py 脚 本 ， 而 不 是 把 新 内 容 集成 到 omh4cli.py 里 : 


import omh4cli 
# command-line interface for a very outstanding feature 
def cli4vof(): 

omhácli.cli, util () 


前 边 已 经 提 到 ， 工 具 函 数 是 的 ， 而 且 由 于 不 能 把 代码 从 主 控制 器 复制 出 来 ， 所 
以 我 们 导入 了 主 模 块 ， 在 我 们 的 控制 器 中 添加 对 omh, omh4cli() 的 调用 。 


问题 在 于 主 控制 器 omh4cli 会 导入 我 们 的 cli4vof 模 块 (获得 新 命令 的 函数 ) ， 而 cli4vof 也 会 导 
入 omh4cli (用 于 获得 工具 函数 ) 。 模 块 导 入 会 失败 ， 这 是 因为 Python 尝试 导入 一 个 先前 没有 
完全 导入 的 模块 : 
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$ python omh4cli.py 
Traceback (most recent call last): 
File "omh4cli.py", line 3, in ? 
from cli4vof import cli4vof 
File "/usr/prod/cli4vof.py", line 3, in ? 
import omh4cli 
File "/usr/prod/omh4cli.py", line 3, in ? 
from cli4vof import cli4vof 


ImportError: cannot import name cli4vof 


注意 跟踪 记录 中 显示 的 对 cli4vof 的 循环 导入 。 问 题 在 于 要 想 调 用 工具 函数 ，cli4vof 必 须 导 入 
omh4cli。 如 果 它 不 需要 这 样 做 ， 那 么 omh4cli 将 会 成 功 导 入 cli4vof， 程 序 正常 执行 。 但 在 这 
里 ，omh4cli 尝 试 导入 cli4vof， 而 cli4vof 也 试 着 导入 omh4cli。 最 后 谁 也 不 会 完成 导入 工作 ， 引 
发 错误 。 这 只 是 一 个 导入 循环 的 例子 。 事 实 上 实际 应 用 中 会 出 现 更 复杂 的 情况 。 
解决 这 个 问题 几乎 总 是 移 除 其 中 一 个 导入 语 多。 你 经 常会 在 模块 的 最 后 看 到 import 语 如。 作为 
一 个 初学 者 ， 你 只 需要 试 着 习惯 它们 ， 如 果 你 以 前 遇 到 在 模块 底部 的 import 语 句 ， 现 在 你 知道 
是 为 什么 了 。 在 我 们 的 例子 中 ， 我 们 不 能 把 import omh4cli 移 到 最 后 ， 因 为 调用 cli4vof() 的 时 
候 omh4cli() 名 字 还 没有 被 载 入 。 
$ python omh4cli.py 
Traceback (most recent call last): 
File "omh4cli.py", line 3, in ? 
from cli4vof import cli4vof 
File "/usr/prod/cli4vof.py", line 7, in ? 
import omh4cli 
File "/usr/prod/omh4cli.py", line 13, in ? 
omh4cli () 
File "/usr/prod/omh4cli.py", line 11, in omh4cli 
cli4vof() 
File "/usr/prod/cli4vof.py", line 5, in cli4vof 
omh4ácli.cli util() 


NameError: global name 'omh4cli' is not defined 
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def cli4vof() 
import omh4cli 


ombscGlis cll OTIL) 


这 样 ， 从 omh4cli() 导 入 cli4vof() 模 块 会 顺利 完成 ， 在 omh4cli() 被 调用 之 前 它 会 被 正确 导入 。 只 
有 在 执行 到 cli4vof.cli4vof() 时 候 才 会 导入 omh4cli 模 块 。 


12.8.6 ”模块 执行 


有 很 多 Don 通过 命令 行 或 shell、execfile()、 模 块 导 入 、 解 释 器 的 - 
m 选 项 等 。 这 已 经 超出 了 本 章 的 范围 。 你 可 以 参考 第 14 章 ， 里 边 全 面 地 介绍 了 这 些 特性 。 


“2 AL 
12.9 相关 模块 
下 边 这 些 模块 可 能 是 你 在 处 理 Python 模 块 导入 时 会 用 到 的 辅助 模块 。 在 这 之 中 ， 
modulefinder、pkgutil 和 zipimport 是 Python 2.3 新 增 内 容 ，distutils 包 在 Python 2.0 被 引入 。 
e imp 一 这 个 模块 提供 了 一 些 底层 的 导入 者 功能 。 


e modulefinder 一 该 模块 允许 你 查找 Python 脚本 所 使 用 的 所 有 模块 。 你 可 以 使 用 其 中 
的 ModuleFinder 类 或 是 把 它 作 为 一 个 脚本 执行 ， 提 供 你 要 分 析 的 〈 另 个 ) Python 模 
块 的 文件 名 。 


e pkgutil 一 该 模块 提供 了 多 种 把 Python 包 打包 为 一 个 “ 包 " 文 件 分 发 的 方法 。 类 似 site 模 
块 ， 它 使 用 *.pkg 文 件 帮 助 定义 包 的 路 径 ， 类 似 site 模 块 使 用 的 *.pth 文 件 。 


o site 一 和 *.pth 文 件 配 合 使 用 ， 指 定 包 加 入 Python 路 径 的 顺序 ， 例 如 sys. path, 
PYTHONPATH。 你 不 需要 显 式 地 导入 它 ， 因 为 Python 导 入 时 默认 已 经 使 用 该 模块 。 
你 可 能 需要 使 用 -S 开 关 在 Python 启 动 时 关闭 它 。 你 也 可 以 完成 一 些 site 相 关 的 自 定义 
操作 ， 例 如 在 路 径 导 入 完成 后 在 另 个 地 方 尝试 。 


e 你 可 以 使 用 该 模块 导入 ZIP 归 档 文 件 中 的 模块 。 需 要 注意 的 是 该 功能 已 经 "自动 " 开 
启 ， 所 以 你 不 需要 在 任何 应 用 中 使 用 它 。 在 这 里 我 们 提出 它 只 是 作为 参考 


e 该 模块 提供 了 对 建立 、 安 装 、 分 发 Python 模块 和 包 的 支持 。 它 还 可 以 帮 Fiche 
C/C++ 完 成 的 Python 扩展 。 更 多 关于 distutils 的 信息 可 以 在 Python 文档 里 找到 ， 
阅 : 


http://docs.python.org/dist/dist.html 


http://docs.python.org/inst/inst.html 
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12.10 练习 


12-1. 路 径 搜 索 和 搜索 路 径 。 路 径 搜 索 和 搜索 路 径 之 间 有 什么 不 同 ? 
12-2. 导 入 属性 。 假 设 你 的 模块 mymodule 里 有 一 个 foo() 函 数 。 

(a) 把 这 个 函数 导入 到 你 的 名 称 空 间 有 哪 两 种 方法 了 

(b) 这 两 种 方法 导入 后 的 名 称 空间 有 什么 不 同 ? 
12-3. 导 入 “import module” 和 “fromn module import” 4 4t 4 4 A ? 
12-4. 名 称 空间 和 变量 作用 域 。 名 称 空间 和 变量 作用 域 有 什么 不 同 ? 
12-5. 使 用 _ import_()。 


(a) 使 用 import. 把 一 个 模块 导入 到 你 的 名 称 空间 。 你 最 后 使 用 了 什么 样 的 语 
法 ? 


(b) 和 上 边 相 同 ， 使 用 import () 从 指定 模块 导入 特定 的 名 字 。 


12-6. 扩 展 导入 。 创 建 一 个 importAs() 函 数 。 这 个 函数 可 以 把 一 个 模块 导入 到 你 的 名 称 空 
间 ， 但 使 用 你 指定 的 名 字 ， 而 不 是 原始 名 字 。 例 如 ， 调 用 

newname=importAs ('mymodule') 会 导入 mymodule， 但 模块 和 它 的 所 有 元 素 都 通过 新 
名 称 newname 或 newname.attr 访 问 。 这 是 Python 2. 0 引入 的 扩展 导入 实现 的 功能 。 


12-7. 导 入 钓 子 。 研 究 PEP 302 的 导入 钩子 机 制 。 实 现 你 自己 的 导入 机 制 ， 允 许 编码 你 的 
模块 (encryption、bzip2、rot13 等 ) ， 这 样 解释 器 会 自动 解码 它们 并 正确 导入 。 你 可 以 
参看 zip 文 件 导 入 的 实现 (参阅 第 12.5.7 节 ) 。 
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$133 面向 对 象 编 程 


本 章 主题 
4 引言 


e 面向 对 象 编 程 


e 实例 

4 HR EZ EA 

e 子 类 ， 派 生 和 继承 
4 PERRA 

4 定制 类 

e 私有 性 

e 授权 与 包装 

e 相关 模块 

e 新 式 类 的 高 级 特性 


在 我 们 的 描绘 中 ， 类 最 终 解释 了 面向 对 象 编程 (OOP, object-oriented programming) 思想 。 
本 章 中 ， 我 们 首先 将 给 出 一 个 总 体 上 的 概述 ， 涵 盖 了 Python 中 使 用 类 和 OOP 的 所 有 主要 方 
面 。 其 余部 分 针对 类 ， 类 实例 和 方法 进行 详细 探讨 。 我 们 还 将 描述 Python 中 有 关 派 生 或 子 类 
化 及 继承 机 理 。 最 后 ，Python 可 以 在 特定 功能 方面 定制 类 ， 例 如 重 载 操作 符 ， 模 拟 Python 类 
型 等 。 我 们 将 展示 如 何 实现 这 些 特殊 的 方法 来 自 定 义 你 的 类 ， 以 让 它们 表现 得 更 像 Python 的 
内 建 类 型 。 


然而 ， 除 了 这 些 外 ，Python 的 面向 对 象 编程 (OOP) 还 有 一 些 令 人 兴奋 的 变动 。 在 版 本 2. 2 
中 ，Python 社 区 最 终 统一 了 类 型 (type) 和 类 (classe) ， 新 式 类 具备 更 多 高 级 的 OOP 特 
性 ， 扮 演 了 一 个 经 典 类 〈 或 者 说 旧式 类 ) 超 集 的 角色 ， 后 者 是 Python 诞生 时 所 创造 的 类 对 
$e 


下 面 ， 我 们 首先 介绍 在 两 种 风格 的 类 ( 译 者 注 : 新 式 类 和 旧式 类 ) 中 都 存在 的 核心 特性 ， 然 
后 讲解 那些 只 有 新 式 类 才 拥 有 的 的 高 级 特性 。 


o x 
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在 摸 清 OOP 和 类 的 本 质 之 前 ， 我 们 首先 讲 一 些 高 级 主题 ， 然 后 通过 几 个 简单 的 例子 热 一 热 
身 。 如 果 你 刚 学 习 面 向 对 人 象 编程 ， 你 可 以 先 跳 过 这 部 分 内 容 ， 直 接 进入 第 13. 2 节 。 如 果 你 对 
有 关 面 向 对 象 编程 已 经 熟悉 了 ， 并 且 想 了 解 它 在 Python 中 是 怎样 表现 的 ， 那 么 先 看 一 下 这 部 
分 内 容 ， 然 后 再 进入 第 13. 3 节 ， 一 探究 竟 ! 


在 Python 中 ， 面 向 对 象 编 程 主要 有 两 个 主题 ， 就 是 类 和 类 实例 〈 见 图 13-1) 。 
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类 与 实例 相互 关联 着 : GRE RUE MRAZ REI SU CAT AE TE RIS 
的 具体 信息 。 


下 面 的 示例 展示 了 如 何 创 建 一 个 类 : 

class MyNewObjectType(bases): 
'define MyNewObjectType class' 
class suite 


关键 字 是 class， 紧 接着 是 一 个 类 名 。 随 后 是 定义 类 的 类 体 代码 。 这 里 通常 由 各 种 各 样 的 定义 
和 声明 组 成 。 新 式 类 和 经 典 类 声明 的 最 大 不 同 在 于 ， 所 有 新 式 类 必须 继承 至 少 一 个 父 类 ， 参 
数 bases 可 以 是 一 个 ( 单 继承 ) 或 多 个 (多 重 继 承 ) 用 于 继承 的 父 类 。 


object 是 “所 有 类 之 母 "。 如 果 你 的 类 没有 继承 任何 其 他 父 类 ，object 将 作为 默认 的 父 类 。 它 位 
于 所 有 类 继承 结构 的 最 上 层 。 如 果 你 没有 直接 或 间接 的 子 类 化 一 个 对 象 ， 那 么 你 就 定义 了 一 
个 经 典 类 : 


class MyNewObjectType: 
'define MyNewObjectType classic class' 
class suite 
如 果 你 没有 指定 一 个 父 类 ， 或 者 如 果 所 子 类 化 的 基本 类 没有 父 类 ， 你 这 样 就 是 创建 了 一 个 经 


典 类 。 很 多 Python 类 都 还 是 经 典 类 。 即 使 经 典 类 已 经 过 时 了 ， 在 以 后 的 Python 版 本 中 ， 仍 然 
可 以 使 用 它们 。 不 过 我 们 强烈 推荐 你 尽 可 能 使 用 新 式 类 ， 尽 管 对 于 学 习 来 说 ， 两 者 都 行 。 
左边 的 工厂 制造 机 器 相当 于 类 ， 而 生产 出 来 的 玩具 就 是 它们 各 个 类 的 实例 。 尽 管 每 个 实例 都 
有 一 个 基本 的 结构 ， 但 各 自 的 属性 像 颜色 或 尺寸 可 以 改变 一 一 这 就 好 上 比 实例 的 属性 。 


创建 一 个 实例 的 过 程 称 作 实 例 化 ， 过 程 如 下 (注意 : 没有 使 用 new 关 键 字 ) : 
myFirstObject = MyNewObjectType () 


类 名 使 用 我 们 所 熟悉 的 函数 操作 符 (()) ， 以 “函数 调用 ”的 形式 出 现 。 然 后 你 通常 会 把 这 个 新 
建 的 实例 赋 给 一 个 变量 。 赋 值 在 语法 上 不 是 必须 的 ， 但 如 果 你 没有 把 这 个 实例 保存 到 一 个 变 
量 中 ， 它 就 没 用 了 ， 会 被 自动 垃圾 收集 器 回收 ， 因 为 任何 引用 指向 这 个 实例 。 这 样 ， 你 刚刚 
所 做 的 一 切 ， 就 是 为 那个 实例 分 配 了 一 块 内 存 ， 随 即 又 释放 了 它 。 


类 既 可 以 很 简单 ， 也 可 以 很 复杂 ， 这 全 和 赁 你 的 需要 。 最 简单 的 情况 ， 类 仅 用 作 名 称 空间 
(namespace) (参见 第 11 章 ) 。 这 意味 着 你 把 数据 保存 在 变量 中 ， 对 他 们 按 名 称 空间 进行 
分 组 ， 使 得 他 们 处 于 同样 的 关系 空间 中 一 所 谓 的 关系 是 使 用 标准 Python 多 点 属性 标识 。 例 


如 ， 你 有 一 个 本 身 没 有 任何 属性 的 类 ， 使 用 它 仅 对 数据 提供 一 个 名 字 空 间 ， 让 你 的 类 拥有 像 
Pascal 中 的 记录 集 (record) 和 C 语 言 中 的 结构 体 (structure) 一 样 的 特性 ， 或 者 换 和 句 话说 ， 
这 样 的 类 仅 作 为 容器 对 象 来 共享 名 字 空 间 。 


示例 如 下 : 


class MyData (object): 


pass 


注意 有 的 地 方 在 语法 构成 上 需要 有 一 行 语句 ， 但 实际 上 不 需要 做 任何 操作 ， 这 时 候 可 以 使 用 
pass 语 多。 这 种 情况 ， 必 要 的 代码 就 是 类 体 ， 但 我 们 暂 不 想 提供 这 些 。 上 面 定 义 的 类 没有 任 
何方 法 或 属性 。 下 面 我 们 创建 一 个 实例 ， 它 只 使 用 类 作为 名 称 室 间 容器 。 


>>> mathObj = MyData() 


Il 
D» 


>>> mathObj.x 


Ii 
UI 


>>> mathObj.y 
>>> mathObj.x + mathObj.y 


9 
>>> mathObj.x * mathObj.y 
20 


我 们 当然 也 可 以 使 用 变量 “xX”"，“y” 来 完成 同样 的 事情 ， 但 本 例 中 ， 实 例 名 字 mathObj 将 
mathObj.x 和 mathObj.y 关 联 起 来 。 这 就 是 我 们 所 说 的 使 用 类 作为 名 字 空 间 容 器 。mathObj.x 和 
mathObj.y 是 实例 属性 ， 因 为 它们 不 是 类 MyData 的 属性 ， 而 是 实例 对 象 (mathObj) 的 独 有 属 
性 。 本 章 后 面 ， 我 们 将 看 到 这 些 属 性 实质 上 是 动态 的 : 你 不 需要 在 构造 器 中 ， 或 其 他 任何 地 
方 为 它们 预先 声明 或 者 赋值 。 


2. 方法 


我 们 改进 类 的 方式 之 一 就 是 给 类 添加 功能 。 类 的 功能 有 一 个 更 通俗 的 名 字 叫 方法 。 在 Python 
中 ， 方 法 定义 在 类 定义 中 ， 但 只 能 被 实例 所 调用 。 也 就 是 说 ， 调 用 一 个 方法 的 最 终 途 径 必 须 
是 这 样 的 (1) 定义 类 (和 方法 ) ; (2) 创建 一 个 实例 ; (3) 最 后 一 步 ， 用 这 个 实例 调用 
方法 。 例 如 


class MyDataWithMethod (object): # 定义 类 
def printFoo (self): # 定义 方法 


print 'You invoked printFoo()!' 


你 可 能 注意 到 了 self 参 数 ， 它 在 所 有 的 方法 声明 中 都 存在 。 这 个 参数 代表 实例 对 象 本 身 ， 当 你 
用 实例 调用 方法 时 ， 由 解释 器 悄悄 地 传递 给 方法 的 ， 所 以 ， 你 不 需要 自己 传递 self 进 来 ， 因 为 
它 是 自动 传 入 的 。 


举例 说 明 一 下 ， 假 如 你 有 一 个 带 两 参数 的 方法 ， 所 有 你 的 调用 只 需要 传递 第 二 个 参数 ， 
ee ee 来 ， 如 果 你 犯错 的 话 ， 也 不 要 紧 。Python 将 告诉 你 传 入 的 
。 o 总之， 你 只 会 犯 一 次 错 ， 下 一 次 ...... 你 当然 就 记得 了 |! 
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体验 ， 所 以 请 意识 到 这 点 。 


Python 的 哲学 本 质 上 就 是 要 明白 清晰 。 在 其 他 语言 中 ，self 称 为 "this"”。 可 以 在 13. 7 一 节 的 ” 核 
心 笔记 "中 找到 有 关 self 更 多 内 容 。 一 般 的 方法 会 需要 这 个 实例 (sel) ， 而 静态 方法 或 类 方法 
不 会 ， 其 中 类 方法 需要 类 而 不 是 实例 。 在 第 13. 8 节 中 可 以 看 到 有 关 静 态 方法 和 类 方法 的 更 多 
内 容 。 


现在 我 们 来 实例 化 这 个 类 ， 然 后 调用 那个 方法 : 


>>> myObj = MyDataWithMethod() # 创建 实例 
>>> myObj.printFoo() # 现在 调用 方法 


You invoked printFoo()! 


在 本 节 结 束 时 ， 我 们 用 一 个 稍 复杂 的 例子 来 总 结 一 下 这 部 分 内 容 ， 这 个 例子 给 出 如 何 处 理 类 
(和 实例 ) ， 还 介绍 了 一 个 特殊 的 方法 _init_()， 子 类 化 及 继承 。 


对 于 已 熟悉 面向 对 象 编程 的 人 来 说 ，_init () 类 似 于 类 构造 器 。 如 果 你 初 涉 OOP 世 界 ， 可 以 
认为 一 个 构造 器 仅 是 一 个 特殊 的 方法 ， 它 在 创建 一 个 新 的 对 象 时 被 调用 。 在 Python 中 ， 

int _() 实 际 上 不 是 一 个 构造 器 。 你 没有 调用 "new” 来 创建 一 个 新 对 象 。 (Python 根 本 就 没 
有 “new” 关 键 字 ) 。 取 而 代 之 ，Python 创 建 实例 后 ， 在 实例 化 过 程 中 ， 调 用 init _() 方 法 ， 当 
一 个 类 被 实例 化 时 ， 就 可 以 定义 额外 的 行为 ， 比 如 ， 设 定 初 始 值 或 者 运行 一 些 初步 诊断 代码 
一 一 主要 是 在 实例 被 创建 后 ， 实 例 化 调用 返回 这 个 实例 之 前 ， 去 执行 某 些 特定 的 任务 或 设 
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我 们 将 把 print 语 句 添加 到 方法 中 ， 这 样 我 们 就 清楚 什么 时 候 方法 被 调用 了 。 通 常 ， 我 们 不 把 
输入 或 输出 语句 放 入 函数 中 ， 除 非 预 期 代码 体 有 具有 输出 的 特性 。 


3. 创建 一 个 类 (类 定义 ) 


class AddrBookEntry (object): # 类 定义 


'address book entry class' 


def init (self, nm, ph): # 定义 构造 器 
self.name = nm # 设置 name 
self.phone = ph # 设置 phone 


print 'Created instance for:', self.name 
def updatePhone(self, newph): # 定义 方法 
self.phone = newph 


print 'Updated phone# for:', self.name 


在 AddrBookEntry 类 的 定义 中 ， 定 义 了 两 个 方法 : 0 dnit ()feupdatePhone() init ()4& È 4 
化 时 被 调用 ， 即 ， 在 AddrBookEntry() 被 调用 时 。 你 可 以 认为 实例 化 是 对 init () 的 一 种 隐 式 
的 调用 ， 因 为 传 给 AddrBookEntry() 的 参数 完全 与 ”init _() 接 收 到 的 参数 是 一 样 的 (除了 
self， 它 是 自动 传递 的 ) 。 

回忆 一 下 ， 当 方法 在 实例 中 被 调用 时 ，self (实例 对 象 ) 参数 自动 由 解释 器 传递 ， 所 以 在 上 面 
&j init () 中 ， 需 要 的 参数 是 nm 和 ph， 它 们 分 别 表 示 名 字 和 电话 号 码 。 init () 在 实例 化 
时 ， 设 置 这 两 个 属性 ， 以 便 在 实例 从 实例 化 调用 中 返回 时 ， 这 两 个 属性 对 程序 员 是 可 见 的 。 
你 可 能 已 猜 到 ，updatePhone() 方 法 的 目的 是 替换 地 址 本 条 目的 电话 号 码 属 性 。 

4. 创建 实例 (实例 化 ) 


>>> john = AddrBookEntry('John Doe', '408-555-1212') # 为 John Doe 创建 实例 
555-1212') # 为 Jane Doe 创建 实例 


> jane * AddrBookEntry('Jane Doe', '650 


这 就 是 实例 化 调用 ， 它 会 自动 调用 _init_() 。self 把 实例 对 象 自动 传 入 ) — init _()。 你 可 以 在 
脑子 里 把 方法 中 的 self 用 实例 名 替换 掉 。 在 上 面 第 一 个 例子 中 ， 当 对 象 john 被 实例 化 后 ， 它 的 
john. name 就 被 设置 了 ， 你 可 在 下 面 得 到 证 实 。 


另外 ， 如 果 不 存在 默认 的 参数 ， 那 么 传 给 ”init () 的 两 个 参数 在 实例 化 时 是 必须 的 。 


5. 访问 实例 属性 


>>> john 

« main .AddrBookEntry instance at 80ee610» 

>>> john.name 

'John Doe' 

>>> john.phone 

"408-555-1212" 

>>> jane.name 

'Jane Doe' 

>>> jane.phone 

"650-555-1212" 
一 旦 实例 被 创建 后 ， 就 可 以 证 实 一 下 ， 在 实例 化 过 程 中 ， 我 们 的 实例 属性 是 否 确 实 被 
. init (设置 了 。 我 们 可 以 通过 解释 器 “ 转 储 "实例 来 查看 它 是 什么 类 型 的 对 象 。 (以 后 我 们 将 


学 到 如 何 定制 类 来 获得 想 要 的 Python 对 象 字符 囊 的 输出 形式 ， 而 不 是 现在 看 到 的 默认 的 
Python 对 象 字 符 囊 (<...>) ) 


6. 方法 调用 (通过 实例 ) 


»»» john.updatePhone('415-555-1212') # 更 新 John Doe 的 电话 
>>> john.phone 


!*415-555-1212"' 


updatePhone() 方 法 需要 一 个 参数 (不计 self 在 内 ) : 新 的 电话 号 码 。 在 updatePhone() 之 后 ， 
立即 检查 实例 属性 ， 可 以 证 实 已 生效 。 


7. 创建 子 类 


靠 继承 来 进行 子 类 化 是 创建 和 定制 新 类 类 型 的 一 种 方式 ， 新 的 类 将 保持 已 存在 类 所 有 的 特 
性 ， 而 不 会 改动 原来 类 的 定义 ( 指 对 新 类 的 改动 不 会 影响 到 原来 的 类 译 者 注 ) 。 对 于 新 
类 类 型 而 言 ， 这 个 新 的 子 类 可 以 定制 只 属于 它 的 特定 功能 。 除 了 与 父 类 或 基 类 的 关系 外 ， 子 
类 与 通常 的 类 没有 什么 区 别 ， 也 像 一 般 类 一 样 进行 实例 化 。 注 意 下 面 ， 子 类 声明 中 提 到 了 父 
E 





class EmplAddrBookEntry (AddrBookEntry): 
'Employee Address Rook Entry class'# R Tb hE $8625 
def init (self, nm, ph, id, em): 
AddrBookEntry. init (self, nm, ph) 
self.empid = id 


self.email = em 


def updateEmail(self, newem): 
self.email = newem 


print 'Updated e-mail address for:', self.name 


现在 我 们 创建 了 第 一 个 子 类 ，EmplAddrBookEntry。 Python 中 ， 当 一 个 类 被 派生 出 来 ， 子 类 
就 继承 了 基 类 的 属性 ， 所 以 ， 在 上 面 的 类 中 ， 我 们 不 仅 定义 了 __init _(), updatEmail() 方 法 ， 
而 且 EmplAddrBookEntry 还 从 AddrBookEntry 中 继承 了 updatePhone() 方 法 。 


如 果 需 要 ， 每 个 子 类 最 好 定义 它 自己 的 构造 器 ， 不 然 ， 基 类 的 构造 器 会 被 调用 。 然 而 ， 如 果 
子 类 重 写 基 类 的 构造 器 ， 基 类 的 构造 器 就 不 会 被 自动 调用 了 一 一 这 样 ， 基 类 的 构造 器 就 必须 
显 式 写 出 才 会 被 执行 ， 像 我 们 上 面 那 样 ， 用 AddrBookEntry__init_() 设 置 名 字 和 电话 号 码 。 
我 们 的 子 类 在 构造 器 后 面 几 行 还 设置 了 另外 两 个 实例 属性 : 员工 ID 和 电子 邮件 地 址 。 


注意 ， 这 里 我 们 要 显 式 传递 self 实 例 对 象 给 基 类 构造 器 ， 因 为 我 们 不 是 在 该 实例 中 而 是 在 一 个 
子 类 实例 中 调用 那个 方法 。 因 为 我 们 不 是 通过 实例 来 调用 它 ， 这 种 未 绑 定 的 方法 调用 需要 传 
递 一 个 适当 的 实例 (self) 给 方法 。 

TARRAT ， 告 诉 我 们 如 何 创建 子 类 的 实例 ， 访 问 它 们 的 属性 及 调用 它 的 方法 ， 包 括 
类 继 承 而 来 的 方法 。 


8. 使 用 子 类 


>>> john = EmplAddrBookEntry('John Doe', '408-555-1212',42, 'johnêspam. doe’) 
Created instance for: John Doe i£ John Doe 创建 实例 
main .EmplAddrBookEntry object at 0x62030» 
»»» john.name 
t John D we" 
>>> john.phone 
'408-555-1212"' 
»»» john.email 
' johnéspam.doe' 
>>> john.updatePhone('415-555-1212") 
Updated phonet for: John Doe 
»»» john.phone 
415-555-1212' 
^ john.updateEmail('john8doe.spam') 


Updated e-mail address for: John Doe 


>>> john.email 


'John68doe.spam' 


核心 笔记 : 命名 美 、 属 性 和 方法 


类 名 通常 由 大 写字 母 打 头 。 这 是 标准 惯例 ， 可 以 帮助 你 识别 类 ， 特 别 是 在 实例 化 过 程 中 (有 
时 看 起 来 像 函 数 调用 ) 。 还 有 ， 数 据 属 性 听 起 来 应 当 是 数据 值 的 名 字 ， 方 法 名 应 当 指 出 对 应 

对 象 或 值 的 行为 。 另 一 种 表达 方式 是 : 数据 值 应 该 使 用 名 词 作为 名 字 ， 方 法 使 用 谓词 (动词 

加 对 象 ) 。 数 据 项 是 操作 的 对 象 、 方 法 应 当 表 明 程 序 员 想 要 在 对 象 进行 什么 操作 。 在 上 面 我 

们 定义 的 类 中 ， 遵 循 了 这 样 的 方针 ， 数 据 值 像 "name”`\“phone" 和 "emai"， 行 为 

如 "updatePhone”,“updateEmai"。 这 就 是 常 说 的 “混合 记 法 (mixedCase) "或 “骆驼 记 法 
(camelCase) ”( 因 为 单词 之 间 没 有 空格 但 首 字母 都 大 写 ， 这 样 看 上 去 类 似 驼 峰 ， 故 而 得 

名 。 译 者 注 ) » "Python Style Guide" 推 荐 使 用 骆驼 记 法 的 下 划 线 方式 ， 比 

+4 > "update phone", "update email" ° 3&4, X 2a E45 > 

像 ‘AddrBookEntry”*、“RepairShop” 等 就 是 很 好 的 名 字 。 


我 希望 你 已 初步 理解 如 何在 Python 中 进行 面向 对 象 编程 了 。 本 章 其 他 小 节 将 带 你 深入 到 面向 
对 象 编程 ，Python 类 及 实例 的 方方面面 。 


13.2 dü epp A dE 


编程 的 发 展 已 经 从 简单 控制 流 中 按 步 的 指令 序列 进入 到 更 有 组 织 的 方式 中 ， 依 千代 码 块 可 以 
形成 命名 子 程序 和 完成 既定 的 功能 。 结 构 化 的 或 过 程 ， dd 以 让 我 们 把 程序 组 织 成 逻辑 
块 ， 以 便 重复 或 重用 。 创 建 程序 的 过 程 变 得 更 具 远 辑 性 ; 选 出 的 行为 要 符合 规范 ， 才 可 以 约 
束 创建 的 数据 。Deitel 父 子 (这 里 指 DEITEL 系 列 书 sd Harvey M. DeitelfePaul James 
Deitel 父 子 ， 译 者 注 ) 认为 结构 化 编程 是 “面向 行为 "的 ， 因 为 事实 上 ， 即 使 没有 任何 行为 的 数 
据 也 必须 “规定 ?逻辑 性 。 


然而 ， 如 果 我 们 能 对 数据 加 上 动作 呢 ? 如 果 我 们 所 创建 和 编写 的 数据 片段 ， 是 上 丫 实 生活 中 实 
体 的 模型 ， 内 诅 数 据 体 和 动作 呢 ? 如果 我 们 能 通过 一 系列 已 定义 的 接口 (又 称 存 取 函 数 集 
合 ) 访问 数据 属性 ， 像 自动 取款 机 (ATM) 卡 或 能 访问 你 的 银行 账号 的 个 人 支票 ， 我 们 就 有 
PN RE 从 大 的 方面 来 看 ， 每 一 个 对 象 既 可 以 与 自身 进行 交互 ， 也 可 以 与 其 他 对 象 
行 交 互 。 


面向 对 象 编程 路 上 了 进化 的 阶梯 ， 增 强 了 结构 化 编程 ， 实 现 了 数据 与 动作 的 融合 : 数据 层 和 
逻辑 层 现在 由 一 个 可 用 以 创建 这 些 对 象 的 简单 抽象 层 来 描述 。 现 实 世 界 中 的 问题 和 实体 完全 
暴露 了 本 质 ， 从 中 提供 的 一 种 抽象 ， 可 以 用 来 进行 相似 编码 ， 或 者 编 入 能 与 系统 中 对 象 进行 
交互 的 对 象 中 。 类 提供 了 这 样 一些 对 象 的 定义 ， 实 例 即 是 这 些 定 义 的 实现 。 二 者 对 面向 对 象 
设计 (object-oriented design, OOD) 来 说 都 是 重要 的 ，OOD 仅 意味 来 创建 你 采用 面向 对 象 
方式 架构 来 创建 系统 。 


13.2.1 面向 对 象 设 计 与 面向 对 得 编程 的 关系 


面向 对 象 设计 (OOD ) 不 会 特别 要 求 面 向 对 象 编程 语言 。 事 实 上 ，QOOD 可 以 由 纯 结构 化 语言 
来 实现 ， 比 如 C， 但 如 果 想 要 构造 具备 对 象 性 质 和 特点 的 数据 类 型 ， 就 需要 在 程序 上 作 更 多 的 
努力 。 当 一 门 语言 内 建 00 特 性 ，00 编 程 开发 就 会 更 加 方便 高 效 。 


另 一 方面 ， 一 门面 向 对 象 的 语言 不 一 定 会 强制 你 写 OO 方 面 的 程序 。 例 如 C++ 可 以 被 认为 “更 好 
的 C”; 而 Java， 则 要 求 万 物 恬 类 ， 此 外 还 规定 ， 一 个 源 文 件 对 应 一 个 类 定义 。 然 而 ， 在 
Python 中 ， 类 和 OOP 都 不 是 日 常 编程 所 必需 的 。 尽 管 它 从 一 开始 设计 就 是 面向 对 象 的 ， 并 且 
结构 上 支持 OOP， 但 Python 没有 限定 或 要 求 你 在 你 的 应 用 中 写 DO 的 代码 。OOP 是 一 门 强大 
的 工具 ， 不 管 你 是 准备 入 门 、 学 习 、 过 渡 或 是 转向 OOP， 都 可 以 " 宕 一 斑 而 知 全 狗 "”。 


13.2.2 现实 中 的 问题 


考虑 用 OOD 来 工作 的 一 个 最 重要 的 原因 ， 在 于 它 直接 提供 建 模 和 解决 现实 世界 问题 和 情形 的 

途径 。 比 如 ， 让 你 来 试 着 模拟 一 台 汽 车 维修 店 ， 可 以 让 你 停车 进行 维修 。 我 们 需要 建 两 个 一 

般 实 体 : 处 在 一 个 “系统 "中 并 与 其 交互 的 人 类 ， 和 一 个 修理 店 ， 它 定义 了 物理 位 置 ， 用 于 人 类 

活动 。 因 为 前 者 有 更 多 不 同 的 类 型 ， 我 将 首先 对 它 进行 描述 ， 然 后 描述 后 者 。 在 此 类 活动 

中 ， 一 个 名 为 Person 的 类 被 创建 以 用 来 表示 所 有 的 人 。Person 的 实例 可 以 包括 消费 者 
(Customer) ， 技 工 (Mechanic) ， 还 可 能 是 出 纳 员 (Cashier) 。 这 些 实例 具有 相似 的 行 

为 ， 也 有 独一无二 的 行为 。 比 如 ， 他 们 能 用 声音 进行 交流 ， 都 有 talk() 方 法 ， 还 有 drive_car() 

方法 。 不 同 的 是 ， 技 工 有 repair_car() 方 法 ， 而 出 纳 有 ring_sale() 方 法 。 技 工 有 一 个 

repair certification 属性， 而 所 有 人 都 有 一 个 drivers_license 属 性 。 


最 后 ， 所 有 这 些 实例 都 是 一 个 检查 (overseeing) 类 RepairShop 的 参与 者 ， 后 者 具有 一 个 叫 
operating_hours 的 数据 属性 ， 它 通过 时 间 函 数 来 确定 何 时 顾客 来 修 车 ， 何 时 职员 技工 和 出 纳 
员 来 上 班 。RepairShop 可 能 还 有 一 个 AutoBay 类 ， 拥 有 SmogZone, TireBrakeZone 等 实例 ， 
也 许 还 有 一 个 叫 GeneralRepair 的 实例 。 


我 们 所 编 的 RepairShop 的 一 个 关键 点 是 要 展示 类 和 实例 加 上 它们 的 行为 是 如 何 用 来 对 现实 生 
活 场 景 建 模 的 。 同 样 ， 你 可 以 把 诸如 机 场 、 餐 厅 、 芯 片 工 厂 、 医 院 其 至 一 个 音乐 公司 想像 为 
类 ， 它 们 完全 具备 各 自 的 参与 者 和 功能 性 。 


13.2.3 "EH Ais 


对 于 已 熟悉 有 关 OOP 术 语 的 朋友 来 说 ， 看 Python 中 是 怎么 称呼 的 : 
1. 抽象 /实现 


抽象 指 对 现实 世界 问题 和 实体 的 本 质 表 现 、 行 为 和 特征 建 模 ， 建 立 一 个 相关 的 子 集 ， 可 以 用 
于 描绘 程序 结构 ， 从 而 实现 这 种 模型 。 抽 象 不 仅 包括 这 种 模型 的 数据 属性 ， 还 定义 了 这 些 数 
据 的 接口 。 对 某 种 抽象 的 实现 就 是 对 此 数据 及 与 之 相关 接口 的 现实 化 (realization) 。 现 实 化 
这 个 过 程 对 于 客户 程序 应 当 是 透明 而 且 无 关 的 。 


2. 封装 /接口 


封装 描述 了 对 数据 /信息 进行 隐藏 的 观念 ， 它 对 数据 属性 提供 接口 和 访问 函数 。 通 过 任何 客户 
端 直接 对 数据 的 访问 ， 无 视 接口 与 封装 性 都 是 背道而驰 的 ， 除 非 程序 员 人 允许 这 些 操 作 。 作 为 
实现 的 一 部 分 ， 客 户 端 根本 就 不 需要 知道 在 封装 之 后 ， 数 据 属 性 是 如 何 组 织 的 。 在 Python 
中 ， 所 有 的 类 属性 都 是 公开 的 ， 但 名 字 可 能 被 “混淆 ”了 ， 以 阻止 未 经 授权 的 访问 ， 但 仅 此 而 
已 ， 再 没有 其 他 预防 措施 了 。 这 就 需要 在 设计 时 ， 对 数据 提供 相应 的 接口 ， 以 免 客 户 程序 通 
过 不 规范 的 操作 来 存 取 封装 的 数据 属性 。 


3. 合成 


合成 扩充 了 对 类 的 描述 ， 使 得 多 个 不 同 的 类 合成 为 一 个 大 的 类 ， 来 解决 现实 问题 。 合 成 描述 
了 一 个 异常 复杂 的 系统 ， 比 如 一 个 类 由 其 他 类 组 成 ， 更 小 的 组 件 也 可 能 是 其 他 的 类 ， 数 据 属 
性 及 行为 ， 所 有 这 些 合 在 一 起 ， 彼 此 是 "有 一 个 "的 关系 。 比 如 ，RepairShop “有 一 个 "技工 (应 
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这 些 组 件 要 么 通过 联合 关系 组 在 一 块 ， 意 思 是 说 ， 对 子 组 件 的 访问 是 允许 的 (对 RepairShop 
来 说 ， 顾 客 可 能 请 求 一 个 SmogCheck， 窜 户 程序 这 时 就 是 与 RepairShop 的 组 件 进行 交互 ) ， 
要 么 是 聚合 在 一 起 ， 封 装 的 组 件 仅 能 通过 定义 好 的 接口 来 访问 ， 对 于 客户 程序 来 说 是 透明 

的 。 继 续 我 的 例子 ， 客 户 程 序 可 能 会 建立 一 个 SmogCheck 请 求 来 代表 顾客 ， 但 不 能 够 同 
RepairShop 的 SmogZone 部 分 进行 交互 ， 因 为 SmogZone 是 由 RepairShop 内 部 控制 的 ， 只 能 
通过 smogCheckCar() 方 法 调用 。Python 支 持 上 述 两 种 形式 的 合成 。 


4. 派生 /继承 /继承 结构 


派生 描述 了 子 类 的 创建 ， 新 类 保留 已 存 类 类 型 中 所 有 需要 的 数据 和 行为 ， 但 允许 修改 或 者 其 
他 的 自 定义 操作 ， 都 不 会 修改 原 类 的 定义 。 继 承 描述 了 子 类 属性 从 祖先 类 继承 这 样 一 种 方 
式 。 从 前 面 的 例子 中 ， 技 工 可 能 比 顾客 多 个 汽车 技能 属性 ， 但 单独 的 来 看 ， 每 个 都 “是 一 

个 "人 ， 所 以 ， 不 管 对 谁 而 言 调 用 talk() 都 是 合法 得 ， 因 为 它 是 人 的 所 有 实例 共有 的 。 继 承 结 构 
表示 多 “ 代 " 派 生 ， 可 以 描述 成 一 个 “族谱 ”， 连 续 的 子 类 ， 与 祖先 类 都 有 关系 。 


5. 泛 化 / 特 化 


泛 化 表示 所 有 子 类 与 其 父 类 及 祖先 类 有 一 样 的 特点 ， 所 以 子 类 可 以 认为 同 祖先 类 是 “是 一 
个 ”(is-a) 的 关系 ， 因 为 一 个 派生 对 象 (实例 ) 是 祖先 类 的 一 个 “例子 ”。 比 如 ， 技 工 *“ 是 一 
个 ”人 ， 车 “是 一 个 ”交通 工具 等 。 在 上 面 我 们 间接 提 到 的 族谱 图 中 ， 我 们 可 以 从 子 类 到 祖先 类 
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表示 “是 一 个 "的 关系 。 特 化 描述 所 有 子 类 的 自 定义 ， 也 就 是 ， 什 么 属性 让 它 与 其 祖 
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多 态 的 概念 指出 了 对 象 如 何 通过 他 们 共同 的 属性 和 动作 来 操作 及 访问 ， 而 不 需 考 虑 他 们 具体 
的 类 。 多 态 表 明了 动态 〈 后 来 又 称 运行 时 ) 绑 定 的 存在 ， 人 允 计 重 载 及 运行 时 类 型 确定 和 验 
证 。 

7T. 自省 /反射 


自省 表示 给 予 你 ， 程 序 员 ， 某 种 能 力 来 进行 像 * 手 工 类 型 检查 "的 工作 ， 它 也 被 称 为 反射 。 这 个 
性 质 展 示 了 某 对 象 是 如 何在 运行 期 取得 自身 信息 的 。 如 果 传 一 个 对 象 给 你 ， 你 可 以 查 出 它 有 
什么 能 力 ， 这 样 的 功能 不 是 很 好 吗 ? 这 是 一 项 强大 的 特性 ， 在 本 章 中 ， 你 会 时 常 遇 到 。 如 果 
Python 不 支持 某 种 形式 的 自省 功能 ，dir() 和 type() 内 建 函 数 ， 将 很 难 正 常 工作 。 请 密切 关注 这 
些 调 用 ， 还 有 那些 特殊 属性 ， 像 dict ， name 及 doc 。 可 能 你 对 其 中 一 些 已 经 很 
AAT! 


13.3 X 


回想 一 下 ， 类 是 一 种 数据 结构 ， 我 们 可 以 用 它 来 定义 对 象 ， 后 者 把 数据 值 和 行为 特性 融合 在 
一 起 。 类 是 现实 世界 的 抽象 的 实体 以 编程 形式 出 现 。 实 例 是 这 些 对 象 的 具体 化 。 可 以 类 比 一 
下 ， 类 是 蓝图 或 者 模型 ， 用 来 产生 申 实 的 物体 (实例) 。 因 此 为 什么 是 术语 “class”? 这 个 术 
语 很 可 能 起 源 于 使 用 类 来 识别 和 归 类 特定 生物 所 属 的 生物 种 族 ， 类 还 可 以 派生 出 相似 但 有 差 
异 的 子 类 。 编 程 中 类 的 概念 就 应 用 了 很 多 这 样 的 特征 。 

头 


在 Python 中 ， 类 声明 与 骂 数 声明 很 相似 ， 头 一 行 用 一 个 相应 的 关键 字 ， 接 下 来 是 一 个 作为 它 


的 定义 的 代码 体 ， 如 下 所 示 : 


def functionName (args): 
b 3 r . x. 六 ey dd c Aty 
'function documentation string' (RS SOCREUETET 


function suite ER US 


class ClassName (object): 
f. je eM, A 1! 
'class documentation string' # 类 文档 字符 串 


^12coc ~ ito £284 
Class suite rH 


二 者 都 允许 你 在 他 们 的 声明 中 创建 函数 ， 闭 包 或 者 内 部 函数 (PP EA AAA) ， 还 有 在 类 
中 定义 的 方法 。 最 大 的 不 同 在 于 你 运行 函数 ， 而 类 会 创建 一 个 对 象 。 类 就 像 一 个 Python 容器 
类 型 。 在 这 部 分 ， 我 们 将 特别 留意 类 及 它们 有 什么 类 型 的 属性 。 这 只 要 记 住 ， 尽 管 类 是 对 象 
(在 Python 中 ， 一 切 尼 对 象 ) ， 但 正 被 定义 时 ， 它 们 还 不 是 对 象 的 实现 。 在 下 节 中 会 讲 到 实 
例 ， 所 以 拭目以待 吧 。 不 过 现在 ， 我 们 集中 讲解 类 对 象 。 


当 你 创建 一 个 类 ， 实 际 你 也 就 创建 了 一 个 自己 的 数据 类 型 。 所 以 这 个 类 的 实例 都 是 相似 的 ， 
但 类 彼此 之 间 是 有 区 别 的 (因此 ， 不 同类 的 实例 自然 也 不 可 能 相同 了 ) 。 与 其 玩 那些 从 玩具 
商 那 买 来 的 玩具 礼物 ， 为 什么 不 设计 并 创造 你 自己 的 玩具 来 玩 呢 ? 


类 还 允许 派生 。 你 可 以 创建 一 个 子 类 ， 它 也 是 类 ， 而 且 继 续 了 父 类 所 有 的 特征 和 属性 。 从 
Python 2. 2 开始 ， 你 也 可 以 从 内 建 类 型 中 派生 子 类 ， 而 不 是 仅仅 从 其 他 类 。 


13.3.1 创建 类 
Python 类 使 用 class 关 键 字 来 创建 。 简 单 的 类 的 声明 可 以 是 关键 字 后 紧 跟 类 名 : 


class ClassName(bases): 
'class documentation string' #' 类 文档 字符 串 ' 


class suite # 类 体 


本 章 前 面 的 概述 中 提 到 ， 基 类 是 一 个 或 多 个 用 于 继承 的 父 类 的 集合 ; 类 体 由 所 有 声明 语句， 
类 成 员 定 义 ， 数 据 属性 和 函数 组 成 。 类 通常 在 一 个 模块 的 顶层 进行 定义 ， 以 便 类 实例 能 够 在 
类 所 定义 的 源 代码 文件 中 的 任何 地 方 被 创建 。 


13.3.2 声明 与 定义 


对 于 Python 有 函数 来 说 ， 声 明 与 定义 类 没什么 区 别 ， 因 为 他 们 是 同时 进行 的 ， 定 义 〈 类 体 ) X 
跟 在 声明 ( 含 class 关 键 字 的 头 行 [header line]) 和 可 选 (但 总 是 推荐 使 用 ) 的 文档 字符 串 后 
面 。 同 时 ， 所 有 的 方法 也 必须 同时 被 定义 。 如 果 对 OOP 很 熟悉 ， 请 注意 Python 并 不 支持 纯 虚 
函数 〈 像 C++) 或 者 抽象 方法 (如 在 Java 中 ) ， 这 些 都 强制 程序 员 在 子 类 中 定义 方法 。 作 为 
替代 方法 ， 你 可 以 简单 地 在 基 类 方法 中 引发 NotImplementedError 姬 常 ， 这 样 可 以 获得 类 似 的 


13.4 类 属性 


什么 ER? 属性 就 是 属于 另 一 个 对 象 的 数据 或 者 函数 元 素 ， 可 以 通过 我 们 熟悉 的 句点 属 
EE "e 问 。 一 些 Python 类 型 比如 复数 有 数据 属性 ( 实 部 和 虚 部 ) ， 而 另外 一 些 ， 像 列 
表 和 字典 ， 拥 有 方法 (函数 属性 ) 。 


有 关 属 性 的 一 个 有 趣 的 地 方 是 ， 当 你 正 访问 一 个 属性 时 ， 它 同时 也 是 一 个 对 象 ， 拥 有 它 自 己 


的 属性 ， 可 以 访问 ， 这 导致 了 一 个 属性 链 ， 比 如 ，myThing、subThing、subSubThing。 等 
常见 例子 如 下 : 


. sys.stdout.write('foo') 
. print myModule.myClass. doc 


> myList .extend (map (upper, open('x').readlines())) 


类 属性 仅 与 其 被 定义 的 类 相 绑 定 ， 并 且 因 为 实例 对 象 在 日 常 OOP 中 用 得 最 多 ， 实 例 数据 属性 
是 你 将 会 一 直 用 到 的 主要 数据 属性 。 类 数据 属性 仅 当 需要 有 更 加 “静态 "数据 类 型 时 才 变 得 有 
用 ， 它 和 任何 实例 都 无 关 ， 因 此 ， 这 也 是 为 什么 下 一 节 被 标 为 高 级 主题 ， 你 可 以 选读 (如果 
你 对 静态 不 熟 ， 它 表示 一 个 值 ， 不 会 因为 函数 调用 完毕 而 消失 ， 它 在 每 两 个 函数 调用 的 间 陈 
都 存在 。 或 者 说 ， 一 个 类 中 的 一 些 数 据 对 所 有 的 实例 来 说 ， 都 是 固定 的 。 有 关 静 态 数 据 详细 
内 容 ， 见 下 一 小 节 ) o 


接 下 来 的 一 小 节 中 ， 我 们 将 简要 描述 ， 在 Python 中 ， 方 法 是 如 何 实现 及 调用 的 。 , 
me 在 调用 前 ， 需 要 创建 一 个 实例 。 


13.4.1 类 的 数据 属性 


数据 属性 仅仅 是 所 定义 的 类 的 变量 。 它 们 可 以 像 任何 其 他 变量 一 样 在 类 创建 后 被 使 用 ， 并 
且 ， 要 么 是 由 类 中 的 方法 来 更 新 ， 要 么 是 在 主 程序 其 他 什么 地 方 被 更 新 。 


这 种 属性 已 为 OO 程序 员 所 熟悉 ， 即 静态 变量 ， 或 者 是 静态 数据 。 它 们 表示 这 些 数据 是 与 它们 
所 属 的 类 对 象 绑 定 的 ， 不 依赖 于 任何 类 实例 。 如 果 你 是 一 位 Java 或 C++ 程序 员 ， 这 种 类 型 的 
数据 相当 于 在 一 个 变量 声明 前 加 上 static 关 键 字 。 


静态 成 员 通常 仅 用 来 跟踪 与 类 相关 的 值 。 大 多 数 情况 下 ， 你 会 考虑 用 实例 属性 ， 而 不 是 类 属 
性 。 在 后 面 ， 我 们 正式 介绍 实例 时 ， 将 会 对 类 属性 及 实例 属性 进行 比较 。 


看 下 面 的 例子 ， 使 用 类 数据 属性 (foo) 


>>> class C(object) 
TY foo = 100 


>>> print C, Too 

100 

Sy Q.roo = Giroo t 1 
>> PELINE C. EGO 

101 


注意 ， 上 面 的 代码 中 ， 看 不 到 任何 类 实例 的 引用 。 


13.4.2 Methods 
1. 方法 


方法 ， 比 如 下 面 ， 类 MyClass 中 的 myNoActionMethod 方 法 ， 仅 仅 是 一 个 作为 类 定义 一 部 分 定 
义 的 函数 (这 使 得 方法 成 为 类 属性 ) 。 这 表示 myNoActionMethod 仅 应 用 在 MyClass 类 型 的 对 
象 ( 实 例 ) 上 。 这 里 ，myNoActionMethod 是 通过 句点 属性 标识 法 与 它 的 实例 绑 定 的 。 


>>> class MyClass (object): 


def myNoActionMethod (self): 


pass 


>>> mc = MyClass () 
>>> mc.myNoActionMethod() 


任何 像 函 数 一 样 对 myNoActionMethod 自 身 的 调用 都 将 失败 : 


>>> myNoActionMethod() 
Traceback (innermost last): 
File "«stdin»", line 1, in ? 
myNoActionMethod ( ) 


NameError: myNoActionMethod 


2| 1 NameErrorr $ > 129 4 4/55 E "E | vp o EUR SURE PA Ue o X SERE MR 
myNoActionMethod 是 一 个 方法 ， 表 示 它 属于 一 个 类 ， 而 不 是 全 局 空间 中 的 名 字 。 如 果 
myNoActionMethod 是 在 顶层 作为 函数 被 定义 的 ， 那 么 我 们 的 调用 则 会 成 功 。 


下 面 展示 的 是 ， 甚 至 由 类 对 象 调用 此 方法 也 失败 了 。 
>>> MyClass.myNoActionMethod() 


Traceback (innermost last): 


File "«stdin»", line l, in? 
MyClass.myNoActionMethod() 


TypeError: unbound method must be called with class instance lst argument 


TypeError 异 常 看 起 来 很 让 人 困惑 ， 因 为 你 知道 这 种 方法 是 类 的 一 个 属性 ， 因 此 ， 一 定 很 想 知 
道 为 何 为 失败 吧 ? 接 下 来 将 会 解释 这 个 问题 。 


2. RE ( 比 定 及 非 绑 定 方法 ) 


为 与 OOP 惯 例 保持 一 致 ，Python 严 格 要 求 ， 没 有 实例 ， 方 法 是 不 能 被 调用 的 。 这 种 限制 即 
Python 所 描述 的 绑 定 概念 (binding) ， 在 此 ， 方 法 必须 绑 定 (到 一 个 实例 ) 才能 直接 被 调 
用 。 非 绑 定 的 方法 可 能 可 以 被 调用 ， 但 实例 对 象 一 定 要 明确 给 出 ， 才 能 确保 调用 成 功 。 然 
而 ， 不 管 是 否 绑 定 ， 方 法 都 是 它 所 在 的 类 的 国有 属性 ， 即 使 它们 几乎 总 是 通过 实例 来 调用 
的 。 在 13.7 节 中 ， 我 们 会 更 深入 地 探索 本 主题 。 


13.4.8 ”决定 类 的 属性 


要 知道 一 个 类 有 哪些 属性 ， 有 两 种 方法 。 最 简单 的 是 使 用 dir() 内 建 函 数 。 另 外 是 通过 访问 类 的 
字典 属性 _dict ， 这 是 所 有 类 都 具备 的 特殊 属性 之 一 。 看 一 下 下 面 的 例子 : 


>>> class MyClass (object): 


'MyClass class definition' # 类 定义 
myVersion = '1.1' # 静态 数据 
def showMyVersion(self): # 方法 


print MyClass.myVersion 


根据 上 面 定义 的 类 ， 让 我 们 使 用 dir() 和 特殊 类 属性 ”dict 来 查看 一 下 类 的 属性 : 


>>> dir (MyClass) 





[= ensa nn '. deléttr "y '.di0t hy * dee t 
'.getattribute ', ' hash ', ' init. .', ' modüle ', 
'..new ', ' reduce *', ' reduce ex t ' repr ', 

' .Setattr ', ' str ', ' weakref ', 'myVersion', 
'showMyVersion'] 


>>> MyClass. dict. 
«dictproxy object at 0x62090» 


>>> print MyClass. | dict 


('showMyVersion': «function showMyVersion at 0x59370», 


"dict <attribute ' | dict ' of 'MyClass' objects», 
'myVersion': '1.1', ' weakref ': «attribute 
' weakref ' of 'MyClass' objects», ' doc ': 


'MyClass class definition') 


在 新 式 类 中 ， 还 新 增加 了 一 些 属性 ，dir() 也 变 得 更 健壮 。 作 为 比较 ， 可 以 看 下 经 典 类 是 什么 样 
的 : 


>>> dir(MyClass) 





[' doc ', ' module ', 'showMyVersion', 'myVersion'] 
>>> 

>>> MyClass. dict 

(' doc ': None, 'myVersion': 1, 'showMyVersion': 
«function showMyVersion at 950ed0», ' module ': 


" ain 1} 


从 上 面 可 以 看 到 ，dir() 返 回 的 仅 是 对 象 的 属性 的 一 个 名 字 列 表 ， 而 _dict 返回 的 是 一 个 字 
典 ， 它 的 键 (key) 是 属性 名 ， 键 值 (value) 是 相应 的 属性 对 象 的 数据 值 。 


结果 还 显示 了 MyClass 类 中 两 个 熟悉 的 属性 ，showMyVersion 和 myVersion， 以 及 一 些 新 的 属 
性 。 这 些 属性 ， doc 及 module ， 是 所 有 类 都 具备 的 特殊 类 属性 (另外 还 有 
_ dict ) 。 内 建 的 vars() 函 数 接受 类 对 象 作为 参数 ， 返 回 类 的 _dict 属性 的 内 容 。 


13.4.4 特殊 的 类 属性 


对 任何 类 C， 表 13.1 显 示 了 类 C 的 所 有 特殊 属性 : 




















X 13.1 特殊 类 属性 
C. name | 类 C 的 名 学 《学 符 事 ) 
C. doc | 类 C 的 文档 学 适中 
C bases | 类 C 的 所 有 类 构成 的 元 组 
"oo (C ilt LETY 
C. module | ROCER CLS 版 本 新 增 ) 
m C. chss | AM CINA (MERAH) 





根据 上 面 定 义 的 类 MyClass， 有 如 下 结果 : 


>>> MyClass. — name 


'MyClass' 

>>> MyClass. doc Á 
'MyClass class definition' 
>>> MyClass. bases 


(«type 'object'»,) 


>>> print MyClass. dict 


(' doc ': None, 'myVersion': 1, 'showMyVersion': 

«function showMyVersion at 950ed0», ' module ': ' main "') 
»»» MyClass. module 

U- main_' 

>>> MyClass. _ class 


«type 'type'» 


. name 是 给 定 类 的 字符 名 字 。 它 适用 于 那 种 只 需要 字符 串 〈 类 对 象 的 名 字 ) ， 而 非 类 对 象 
本 身 的 情况 。 甚 至 一 些 内 建 的 类 型 也 有 这 个 属性 ， 我 们 将 会 用 到 其 中 之 一 来 展示 _name € 
符 串 的 益处 


类 型 对 E ois ME ''64 name 的 属性 。 回 忆 一 下 ，type() 返 回 被 调用 对 象 
的 类 型 。 这 可 能 就 是 那 种 我 们 所 说 的 仅 需 要 一 个 字符 串 指明 类 型 ， 而 不 需要 一 个 对 象 的 情 
况 。 S UE 类 型 对 象 的 _name ”属性 来 取得 相应 的 字符 串 名 。 如 下 例 示 : 


>>> stype = type('What is your quest?') 


»»» stype # stype 是 一 个 类 型 对 象 
«type 'string'» 

>>> stype. name # 得 到 类 型 名 (字符 串 表 示 ) 
'string' 

>>> 

>>> type(3.14159265) # 又 一 个 类 型 对 象 


«type 'float'» 
»»» type(3.14159265). name # 得 到 类 型 名 (字符 串 表示 ) 
'float' 


| doc 是 类 的 文档 字符 串 ， 与 函数 及 模块 的 文档 字符 串 相 似 ， 必 须 紧 随 头 行 (header line) 
后 的 字符 串 。 文 档 字 符 串 不 能 被 派生 类 继承 ， 也 就 是 说 派生 类 必须 含有 它们 自己 的 文档 字符 


o 


de 


本 章 后 面 会 讲 到 ， ”bases 用 来 处 理 继承 ， 它 包含 了 一 个 由 所 有 父 类 组 成 的 元 组 。 


"iig dict 属性 包含 一 个 字典 ， 由 类 的 数据 属性 组 成 。 访 问 一 个 类 属性 的 时 候 ，Python 解 
释 器 将 会 搜索 字典 以 得 到 需要 的 属性 。 如 果 在 dict 中 没有 找到 ， 将 会 在 基 类 的 字典 中 进行 
搜索 ， 采 用 “深度 优先 搜索 ”顺序 。 基 类 集 的 搜索 是 按 顺序 的 ， 从 左 到 右 ， 按 其 在 类 定义 时 ， 定 
义 父 类 参数 时 的 顺序 。 对 类 的 修改 会 仅 影响 到 此 类 的 字典 ; 基 类 的 _ dict 属性 不 会 被 改动 
的 。 


Python 支持 模块 间 的 类 继承 。 为 更 清晰 地 对 类 进行 描述 ，1.5 版 本 中 引入 了 _module * È 
样 类 名 就 完全 由 模块 名 所 限定 。 看 一 下 下 面 的 例子 : 


>>> class C(object): 


Pk pass 


> G 
«class _ main .C at Ux53f90» 
»»» C. module 


' gain ' 


类 C 的 全 名 是 main .C”， 比 如 ，source_module.class_name。 如 果 类 C 位 于 一 个 导入 的 
模块 中 ， 如 mymod， 像 下 面 的 : 


>>> from mymod import C 
2o» C 

«class mymod.C at 0x53ea0» 
»»» C. module 

'mymod' 


在 以 前 的 版 本 中 ， 没 有 特殊 属性 ”module ， 很 难 简单 定位 类 的 位 置 ， 因 为 类 没有 使 用 它们 
的 全 名 。 


最 后 ， 由 于 类 型 和 类 的 统一 性 ， 当 访问 任何 类 的 ”class ”属性 时 ， 你 将 发 现 它 就 是 一 个 类 型 
对 象 的 实例 。 换 多 话说 ， 一 个 类 已 是 一 种 类 型 了 。 因 为 经 典 类 并 不 认同 这 种 等 价 性 〈 一 个 经 
殿 类 是 一 个 类 对 象 ， 一 个 类 型 是 一 个 类 型 对 象 ) ， 对 这 些 对 象 来 说 ， 这 个 属性 并 未 定义 。 


13.5 ”实例 


如 果 说 类 是 一 种 数据 结构 定义 类 型 ， 那 么 实例 则 声明 了 一 个 这 种 类 型 的 变量 。 换 言 之 ， 实 例 
是 有 生命 的 类 。 就 像 设 计 完 一 张 蓝图 后 ， 就 是 设法 让 它 成 为 现实 。 实 4 aE 
期 时 的 对 象 ， 类 被 实例 化 得 到 实例 ， 该 实例 的 类 型 就 是 这 个 被 实例 化 的 类 。 在 Python 2.2 版 本 
之 前 ， 实 例 是 “实例 类 型 "， 而 不 考虑 它 从 哪个 类 而 来 。 


13.5.1 初始 化 : 通过 调用 类 对 象 来 创建 实例 


很 多 其 他 的 OO 语言 都 提供 new 关 键 字 ， 通 过 new 可 以 创建 类 的 实例 。Python 的 方式 更 加 简 
单 。 一 旦 定义 了 一 个 类 ， 创 建 实例 比 调用 一 个 函数 还 容易 % 吹 灰 之 力 。 实 例 化 的 实 
现 ， 可 以 使 用 函数 操作 符 ， 如 下 示 : 





>>> class MyClass (object): # 定义 类 
pass 
>>> mc = MyClass() # 初始 化 类 


可 以 看 到 ， 仅 调用 "calling" 类 : MyClass()， 就 创建 了 类 MyClass 的 实例 mc。 返 回 的 对 象 是 你 
所 调用 类 的 一 个 实例 。 当 使 用 函数 记 法 来 调用 “calP 一 个 类 时 ， 解 释 器 就 会 实例 化 该 对 象 ， 并 
且 调 用 Python 所 拥有 与 构造 兄 数 最 相近 的 东西 (如果 你 定义 了 的 话 ) 来 执行 最 终 的 定制 工 
作 ， 比 如 设置 实例 属性 ， 最 后 将 这 个 实例 返回 给 你 。 


核心 笔记 : Python2.2 前 后 的 类 和 实例 


类 和 类 型 在 2.2 版 本 中 就 统一 了 ， 这 使 得 Python 的 行为 更 像 其 他 面向 对 象 编程 语言 。 任 何 类 或 
者 类 型 的 实例 都 是 这 种 类 型 的 对 象 。 比 如 ， 如 果 你 让 Python 告诉 你 ， 类 MyClass 的 实例 mc 是 
否 是 类 MyClass 的 一 个 实例 。 回 答 是 肯定 的 ，Python 不 会 说 谎 。 同 样 ， 它 会 告诉 你 零 是 
integer 类 型 的 一 个 实例 : 


Python 核心 编程 第 二 版 


>>> mc = MyClass() 

>>> type (mc) 

«class ' main .MyClass'» 
>>> type(0) 

«type 'int'5 


但 如 果 你 仔细 看 ， 比 较 MyClass 和 int， 你 将 会 发 现 二 者 都 是 类 型 (type ) : 


>>> type (MyClass) 
<type 'type'> 
>>> type (int) 
<type 'type'> 


对 比 一 下 ， 如 果 在 Python 早 于 2.2 版 本 时 ， 使 用 经 典 类 ， 此 时 类 是 类 对 象 ， 实 例 是 实例 对 象 。 
在 这 两 个 对 象 类 型 之 间 没 有 任何 关系 ， 除 了 实例 的 _class 属性 引用 了 被 实例 化 以 得 到 该 实 


例 的 类 。 把 MyClass 在 Python2.1 版 本 中 作为 经 典 类 重新 定义 ， 并 运行 相同 的 调用 (注意 : 


int() 那 时 还 不 具备 工厂 功能 ...... 它 还 仅 是 一 个 通常 的 内 建 函 数 ) : 


>>> type (mc) 
«type 'instance'» 
>>> type(0) 

«type 'int'» 

>>> 

>>> type (MyClass) 
<type 'class'> 
>>> type (int) 


<type 'builtin_function_or_method'> 


519 


为 了 避免 任何 混淆 ， 你 只 要 记 住 当 你 定义 一 个 类 时 ， 你 并 没有 创建 一 个 新 的 类 型 ， 而 是 仅仅 
一 个 类 对 象 ; 而 对 2.2 版 本 及 后 续 版 本 ， 当 你 定义 一 个 (新 式 的 ) 类 后 ， 你 已 创建 了 一 个 新 的 
类 型 。 


13.5.2 init_() “构造 器 ”方法 


当 类 被 调用 ， 实 例 化 的 第 一 步 是 创建 实例 对 象 。 一 旦 对 象 创建 了 ，Python 检 查 是 否 实现 了 
init _() 方 法 。 默 认 情 况 下 ， 如 果 没 有 定义 (ARA) 特殊 方法 _init _()， 对 实例 不 会 施加 
任何 特别 的 操作 。 任 何 所 需 的 特定 操作 ， 都 需要 程序 员 实 现 _init_()， 履 盖 它 的 默认 行为 。 
如 果 nt () 没 有 实现 ， 则 返回 它 的 对 象 ， 实 例 化 过 程 完毕 。 


然而 ， 如 果 init () 已 经 被 实现 ， 那 么 它 将 被 调用 ， 实 例 对 象 作为 第 一 个 参数 (self) 被 传递 
进去 ， 像 标准 方法 调用 一 样 。 调 用 类 时 ， 传 进 的 任何 参数 都 交 给 了 _init ()。 实 际 中 ， 你 可 
以 想像 成 这 样 : 把 创建 实例 的 调用 当成 是 对 构造 器 的 调用 。 


&X (a) 你 没有 通过 调用 new 来 创建 实例 ， 你 也 没有 定义 一 个 构造 器 。 是 Python 为 你 创建 
了 对 象 ; (b) init. ()， 是 在 解释 器 为 你 创建 一 个 实例 后 调用 的 第 一 个 方法 ， 在 你 开始 使 
用 它 之 前 ， 这 一 步 可 以 让 你 做 些 准备 工作 。 


init _() 是 很 多 为 类 定义 的 特殊 方法 之 一 。 其 中 一 些 特殊 方法 是 预定 义 的 ， 缺 省 情况 下 ， 不 
进行 任何 操作 ， 比 如 init ()， 要 定制 ， 就 必须 对 它 进 行 重 载 ， 还 有 些 方法 ， 可 能 要 按 需 要 
去 实现 。 本 章 中 ， 我 们 会 讲 到 很 多 这 样 的 特殊 方法 。 你 将 会 经 常 看 到 _init_() 的 使 用 ， 在 
此 ， 就 不 举例 说 明了 。 


13.5.3 — new (Une E" 


HZ init () 相 比 ， new ()ZjA £4 — RESI MIIE 3S o AORURR AUERRR222SEUL— 1o 
Python 用 户 可 以 对 内 建 类 型 进行 派生 ， 因 此 ， 需 要 一 种 途径 来 实例 化 不 可 变 对 象 ， 比 如 派生 
字符 串 、 数 字 等 。 

在 这 种 情况 下 ， 解 释 器 则 调用 类 的 _ new __() 方 法 ， 一 个 静态 方法 ， 并 且 传 入 的 参数 是 在 类 实 
例 化 操作 时 生成 的 。_new __() 会 调用 父 类 的 _new_ _() 来 创建 对 象 ( 向 上 代理 ) o 


为 何 我 们 认为 ”new (t init () 更 像 构 造 器 呢 ? 这 是 因为 _ new  () 儿 须 返 回 一 个 合法 的 
实例 ， 这 样 解释 器 在 调用 nt () 时 ， 就 可 以 把 这 个 实例 作为 self 传 给 它 。 调 用 父 类 的 
. new () 来 创建 对 象 ， 正 像 其 他 语言 中 使 用 new 关 键 字 一 样 。 


. new (Me init () 在 类 创建 时 ， 都 传 入 了 (相同 ) 参数 。13.11.3 节 中 有 个 例子 使 用 了 
. new ()° 


13.5.4 del ()“ 解 构 器 ”方法 


同样 ， 有 一 个 相应 的 特殊 解构 器 (destructor) 方法 名 为 _ del ()» 4 > t T Python tA 3 
圾 对 象 回收 机 制 〈 靠 引用 计数 ) ， 这 个 函数 要 直到 该 实例 对 象 所 有 的 引用 都 被 清除 看 后 才 会 
执行 。Python 中 的 解构 器 是 在 实例 释放 前 提供 特殊 处 理 功能 的 方法 ， 它 们 通常 没有 被 实现 ， 
因为 实例 很 少 被 显 式 释放 。 

在 下 面 的 例子 中 ， 我 们 分 别 创建 (EE) int () 和 del _() 构 造 及 解构 函数 ， 然 后 ， 初 
始 化 类 并 给 同样 的 对 象 分 配 很 多 别名 。id() 内 建 函 数 可 用 来 确定 引用 同一 对 象 的 三 个 别名 。 最 
后 一 步 是 使 用 del 语 多 清除 所 有 的 别名 ， 显 示 何 时 调用 了 多 少 次 解构 器 。 


class C(P): à 类 声明 
def init (self): # 构造 器 
print 'initialized' 
def del (self): & 解构 器 
P. del (self) # 调用 父 类 解构 器 来 打印 
print 'deleted' 
»»» cl = C() # 实例 初始 化 
initialized 
»»» c2 = Cl & 创建 另外 一 个 别名 
>>> c3 = c1 # 创建 第 三 个 别名 
>>> id(cl), id(c2), id(c3) # 同一 对 象 所 有 引用 


(11938912, 11938912, 11938912) 
»»» del cl 清除 一 个 引用 
清除 另 一 个 引用 
清除 最 终 引 用 
解构 器 最 后 调用 


注意 ， 在 上 面 的 例子 中 ， 解 构 器 是 在 类 C 实 例 所 有 的 引用 都 被 清除 掉 后 ， 才 被 调用 的 ， 比 如 ， 
当 引 用 计数 已 减少 到 0。 如 果 你 预期 你 的 “del () 方 法 会 被 调用 ， 却 实际 上 没有 被 调用 ， 这 意 
味 着 ， 你 的 实例 对 象 由 于 某 些 原因 ， 其 引用 计数 不 为 0， 这 可 能 有 别 的 对 它 的 引用 ， 而 你 并 不 
知道 这 些 让 你 的 对 象 还 活着 的 引用 所 在 。 


>>> del c2 
>>> del c3 
deleted 


$ $ ë ¢ 4 


另外 ， 要 注意 ， 解 构 器 只 能 被 调用 一 次 ， 一 旦 引用 计数 为 0， 则 对 象 就 被 清除 了 。 这 非常 合 
理 ， 因 为 系统 中 任何 对 象 都 只 被 分 配 及 解构 一 次 。 


Nc 


如 . 
wPTOM c 


e 不 要 忘记 首先 调用 父 类 的 _ del (e 


e 调用 del x 不 表示 调用 了 x. del _() 一 一 前 面 也 看 到 ， 它 仅仅 是 减少 x 的 引用 计数 。 





。 如 果 你 有 一 个 循环 引用 或 其 他 的 原因 ， 让 一 个 实例 的 引用 运 留 不 去 ， 该 对 象 的 
— del () 可 能 永远 不 会 被 执行 。 


。 del _() 未 捕获 的 异常 会 被 忽略 掉 (因为 一 些 在 ”del _() 用 到 的 变量 或 许 已 经 被 删 
RT) 。 不 要 在 del _() 中 和 干 与 实例 没 任何 关系 的 事情 。 
e 除非 你 知道 你 正在 干什么 ， 否 则 不 要 去 实现 del (e 


e 如 果 你 定义 了 del ， 并 且 实 例 是 某 个 循环 的 一 部 分 ， 垃 圾 回收 器 将 不 会 终止 这 个 
循环 一 “你 需要 自己 显 式 调用 del 。 


核心 笔记 : 跟踪 实例 


Python 没有 提供 任何 内 部 机 制 来 跟踪 一 个 类 有 多 少 个 实例 被 创建 了 ， 或 者 记录 这 些 实例 是 些 
什么 东西 。 如 果 需 要 这 些 功 能 ， 你 可 以 显 式 加 入 一 些 代码 到 类 定义 或 者 _init () 和 _del_() 
中 去 。 最 好 的 方式 是 使 用 一 个 静态 成 员 来 记录 实例 的 个 数 。 靠 保存 它们 的 引用 来 跟踪 实例 对 
象 是 很 危险 的 ， 因 为 你 必须 合理 管理 这 些 引 用 ， 不 然 你 的 引用 可 能 没 办 法 释放 (因为 还 有 其 
他 的 引用 ) ! 看 下 面 一 个 例子 : 
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class InstCt (object): 
count = 0 $ count 是 一 个 类 属性 


def init (self): # 增加 count 


InstCt.count += 1 


def del (self): # 减少 count 


InstCt.count 一 三 


def howMany(self): # 返回 count 


return InstCt.count 


>>> a = InstTrack() 


V 

V 

V 
| 


b = InstTrack() 


>>> b.howMany() 
>>> a.howMany() 


>>> del b 

>>> a.howMany() 

1 

>>> del a 

>>> InstTrack.count 
0 


13.6 ”实例 属性 
实例 仅 拥 有 数据 属性 (方法 严格 来 说 是 类 属性 ) ， 后 者 只 是 与 某 个 类 的 实例 相关 联 的 数据 


值 ， 并 且 可 以 通过 多 点 属性 标识 法 来 访问 。 这 些 值 独立 于 其 他 实例 或 类 。 当 一 个 实例 被 释放 
后 ， 它 的 属性 同时 也 被 清除 了 。 


13.6.1 “实例 化 ”实例 属性 (或 创建 一 个 更 好 的 构造 器 ) 
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设置 实例 的 属性 可 以 在 实例 创建 后 任意 时 间 进 行 ， 也 可 以 在 能 够 访问 实例 的 代码 中 进行 。 构 
i$ int () 是 设置 这 些 属性 的 关键 点 之 一 。 


核心 笔记 : 实例 属性 


能 够 在 “运行 时 ?创建 实例 属性 ， 是 Python 类 的 优秀 特性 之 一 ， 从 C++ 或 Java 转 过 来 的 人 会 被 小 
小 地 震惊 一 下 ， 因 为 C++ 或 Java 中 所 有 属性 在 使 用 前 都 必须 明确 定义 /声明 。Python 不 仅 是 动 
态 类 型 ， 而 且 在 运行 时 ， 人 允许 这 些 对 象 属性 的 动态 创建 。 这 种 特性 让 人 爱不释手 。 当 然 ， 我 
们 必须 提醒 读者 ， 创 建 这 样 的 属性 时 ， 必 须 谨 懂 。 一 个 缺陷 是 ， 属 性 在 条 件 语句 中 创建 ， 如 
果 该 条 件 语 句 块 并 未 被 执行 ， 属 性 也 就 不 存在 ， 而 你 在 后 面 的 代码 中 试 着 去 访问 这 些 属性 ， 
就 会 有 错误 发 生 。 故 事 的 精髓 是 告诉 我 们 ，Python 让 你 体验 从 未 用 过 的 特性 ， 但 如 果 你 使 用 
它 了 ， 你 还 是 要 小 心 为 好 。 


1. 在 构造 器 中 首先 设置 实例 属性 


构造 器 是 最 早 可 以 设置 实例 属性 的 地 方 ， 因 为 ”init () 是 实例 创建 后 第 一 个 被 调用 的 方法 。 
没有 比 这 更 早 的 可 以 设置 实例 属性 的 机 会 了 。 一 旦 _init () 执 行 完毕 ， 返 回 实例 对 象 ， 即 

完成 了 实例 化 过 程 。 

2. 默认 参数 提供 默认 的 实例 安装 

在 实际 应 用 中 ， 带 默认 参数 的 _ init _() 提 供 一 个 有 效 的 方式 来 初始 化 实例 。 dec 

默认 值 表 示 设 置 实例 属性 的 最 常见 的 情况 ， 如 果 提 供 了 默认 值 ， 我 们 就 没 必 要 显 式 给 构造 器 

传 值 了 。 我 们 在 11.5.2 节 中 也 提 到 默认 参数 的 常见 好 处 。 需 要 明白 一 点 ， 黑 认 参 数 应 edt 23 


的 对 象 ; 像 列 表 (list) 和 字典 (dictionary) 这 样 的 可 变 对 象 可 以 扮演 静态 数据 ， 然 后 在 每 个 
方法 调用 中 来 维护 它们 的 内 容 。 


例 13.1 描 述 了 如 何 使 用 默认 构造 器 行为 来 帮助 我 们 计算 在 美国 一 些 大 都 市 中 的 旅馆 中 寄宿 
时 7 租房 总 费用 


代码 的 主要 目的 是 来 帮助 某 人 计算 出 每 日 旅馆 租房 费用 ， 包 括 所 有 州 销 售 税 和 房 税 。 缺 省 为 
旧金山 附近 的 普通 区 域 ， 它 有 8.5% 销 售 税 及 10% 的 房间 税 。 每 日 租房 费用 没有 缺 省 值 ， 因 此 
在 任何 实例 被 创建 时 ， 都 需要 这 个 参数 。 


例 13.1 使 用 缺 省 参数 进行 实例 化 


(hotel .py) 


定义 一 个 类 来 计算 这 个 假想 旅馆 租房 费用 。 init () 构 造 器 对 一 些 实例 属性 进行 初始 化 。 
calcTotal() 方 法 用 来 决定 是 计算 每 日 总 的 租房 费用 还 是 计算 全 部 的 租房 费 。 
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l1 class HotelRoomCalc (object): 
'Hotel room rate calculator' 

4 def — init . (self, rt, sales-0.085, rm=0.1): 

5 ''"'HotelRoomCalc default arguments: 

6 sales tax == 8.5% and room tax == 10$''' 

7 self.salesTax = sales 

8 self.roomTax - rm 

9 self.roomRate - rt 

10 

11 def calcTotal(self, days-1): 

12 'Calculate total; default to daily rate' 

13 daily = round((self.roomRate' 

14 (1 + self.roomTax + self.salesTax)), 2) 

15 return float(days) ' daily 


设置 工作 是 由 init () 在 实例 化 之 后 完成 的 ， 如 上 面 的 第 4~8 行 ， 其 余部 分 的 核心 代码 是 

calcTotal() 方 法 ， 从 第 10~14 行 。 init. () 的 工作 即 是 设置 一 些 参 数值 来 决定 旅馆 总 的 基本 租 
FRA (不 包括 住房 服务 ， 电 话费 ， 或 其 他 偶发 事情 ) 。calcTotal() 可 以 计算 每 日 所 有 费用 ， 
如 果 提 供 了 天 数 ， 那 么 将 计算 整个 旅程 全 部 的 住宿 费用 。 内 建 的 round() 函 数 可 以 大 约 计算 出 


最 接近 的 费用 (两 个 小 数位 ) 。 下 面 是 这 个 类 的 用 法 : 


>>> sfo = HotelRoomCalc (299) & 新 的 实例 
>>> sfo.calcTotal() + HH 
354.32 

>>> sfo.calcTotal(2) E 2 天 的 租金 
708 .64 

>>> sea = HotelRoomCalc(189, 0.086, 0.058) # ”新 的 实例 
>>> sea.calcTotal () 

216.22 

>>> sea.calcTotal (4) 

864.88 

»»» wasWkDay = HotelRoomCalc(169, 0.045, 0.02) E 新 实例 
>>> wasWkEnd = HotelRoomCalc(119, 0.045, 0.02) E 新 实例 
>>> wasWkDay.calcTotal(5) + wasWkEnd.calcTotal() 7 大 的 租金 
1026.69 
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最 开始 的 两 个 假想 例子 都 是 在 旧金山 ， 使 用 了 默认 值 ， 然 后 是 在 西雅图 ， 这 里 我 们 提供 了 不 
同 的 销售 税 和 房间 税率 。 最 后 一 个 例子 在 华盛顿 特区 。 经 过 计算 更 长 的 假想 时 间 ， 来 扩展 通 
常 的 用 法 : 停留 5 个 工作 日 ， 外 加 一 个 周 六 ， 此 时 有 特价 ， 假 定 是 星期 天 出 发 回 家 。 


不 要 忘记 ， 兄 数 所 有 的 灵活 性 ， 上 比如 默认 参数 ， 也 可 以 应 用 到 方法 中 去 。 在 实例 化 时 ， 可 变 
长 度 参 数 也 是 一 个 好 的 特性 (当然 ， 这 要 根据 应 用 的 需要 ) o 
3. int (0 应 当 返 回 None 


你 也 知道 ， 采 用 函数 操作 符 调用 类 对 象 会 创建 一 个 类 实例 ， 也 就 是 说 这 样 一 种 调用 过 程 返回 
的 对 象 就 是 实例 ， 下 面 示例 可 以 看 出 : 


>>> class MyClass (object): 

TS pass 

>>> mc = MyClass() 

225» mc 

« main .MyClass instance at 95d390» 
如 果 定 义 了 构造 器 ， 它 不 应 当 返 回 任何 对 象 ， 因 为 实例 对 象 是 自动 在 实例 化 调用 后 返回 的 。 
相应 地 ，_init_() 就 不 应 当 返 回 任何 对 象 (应 当 为 None) : 否则 ， 就 可 能 出 现 冲突 ， 因 为 只 
能 返回 实例 。 试 着 返回 非 None 的 任何 其 他 对 象 都 会 导致 TypeError 异 常 : 

>>> class MyClass: 

def init (self): 
print 'initialized' 


return 1 


>>> mc = MyClass() 
initialized 
Traceback (innermost last): 
File "€stdin»", line 1, in ? 
mc = MyClass () 


TypeError: init |. () should return None 


13.6.2 查看 实例 属性 
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内 建 函 数 dir() 可 以 显示 类 属性 ， 同 样 还 可 以 打印 所 有 实例 属性 : 


>>> class C(object): 
pass 

>>> © = C() 

>>> c.foo = 'roger' 

>>> c.bar = 'shrubber' 


>>> dir (c) 


[* class ". *" dqélabt;o '. "dict. '. 2 

! | Getáttribute "T, ' bash "y "init .', * module"; 
' new ', ' reduce "';,. " reduce ex. ', ' repr ', 
AE Lay o Xpp 5 b owaskret mR *"REGU) 


与 类 相似 ， 实 例 也 有 一 个 dict 特殊 属性 〈 可 以 调用 varsO 并 传 入 一 个 实例 来 获取 ) ， 它 是 
实例 属性 构成 的 一 个 字典 : 
NO m. ) dicb 


['foo':s "roger', 'bar': 'shrubber') 


13.6.3 ”特殊 的 实例 属性 
实例 仅 有 两 个 特殊 属性 ( 见 表 13.2) 。 对 于 任意 对 象 | : 


表 13.2 特殊 实例 属性 


实例 化 1 的 类 





现在 使 用 类 C 及 其 实例 C 来 看 看 这 些 特 殊 实 例 属 性 : 


>>> class C(object): # ”定义 类 

— pass 

>>> c= C() # ”创建 实例 

>>> dir(c) # ”实例 还 没有 属性 
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[] 


>>> c. dict _ _ # ”也 没有 属性 
() 
»»» c. class . # 实例 化 c 的 类 


«class ' main .C'» 


你 可 以 看 到 ，c 现 在 还 没有 数据 属性 ， 但 我 们 可 以 添加 一 些 再 来 检查 “dict 属性 ， 看 是 否 添 
加 成 功 了 : 


225» c.foo 1 

>>> c.bar = 'SPAM' 

>>> '&d can of $s please' $ (c.foo, c.bar) 

'l can of SPAM please' 

200 GG. wb. 

L'foo': l1, 'bax': "SPAM"'] 
. dict 属性 由 一 个 字典 组 成 ， 包 含 一 个 实例 的 所 有 属性 。 键 是 属性 名 ， 值 是 属性 相应 的 数据 
值 。 字 典 中 仅 有 实例 属性 ， 没 有 类 属性 或 特殊 属性 。 





核心 风格 : 修改 dict 


对 类 和 实例 来 说 ， 尽 管 _dict 属性 是 可 修改 的 ， 但 还 是 建议 你 不 要 修改 这 些 字典 ， 除 非 你 知 
道 你 在 干什么 。 这 些 修 改 可 能 会 破坏 你 的 OOP， 造 成 不 可 预料 的 副作用 。 使 用 熟 困 的 句点 属 
性 标识 来 访问 及 操作 属性 会 更 易于 接受 。 需 要 你 直接 修改 ”dict 属性 的 情况 很 少 ， 其 中 之 一 
是 你 要 重 载 _setattr 特殊 方法 。 实 现 setattr () 本 身 是 一 个 冒险 的 经 历 ， 满 是 圈套 和 陷 
阱 ， 例 如 无 穷 递归 和 破坏 实例 对 象 。 这 个 故事 还 是 留 到 下 次 说 吧 。 


13.6.4 建 类 型 属性 


内 建 类 型 也 是 类 ， 它 们 有 没有 像 类 一 样 的 属性 呢 ? 那 实例 有 没有 呢 ? 对 内 建 类 型 也 可 以 使 用 
dir(), 与 任何 其 他 对 象 一 样 ， 可 以 得 到 一 个 包含 它 属性 名 字 的 列表 : 
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>>> x = 3*0.14j 
>>> x. Class. 
«type 'complex'» 


>>> dir(x) 


[^ abs. ', *' add ', "ela ', "2 50001608.—'; 

V HBalaUvts ", * Hw t4 1o abd ' to gon. t mp t, 
U float Te 7". flo0rdiw t; * ge ^, ' getattribute..', 

* Getnewargs ', ' gt ', + hash ', ' linit..', 

E HERES € * dts 'leng " Le BD", 

v Gl ' Uo ww C. * nag f, fw "S o". nonsara 7 

€ 0s *', "V LG0W ', !"orxadd ', Re "'oordivmod. ", 
'* reduce ', ' reduce.ex Vy ' repr ', ' rfloordiv ', 
UV mod. "^ mul ',a*! Now. 'u "o wxsub 

UU dwuerüdediv 72 T dGmeetaEES S4 t" at 6" sub. ^s 


' truediv ', 'conjugate', 'imag', 'real'] 

>>> 

>>> [type(getattr(x, i)) for i in ('conjugate', 'imag', 
'real')] 

[type 'builtin function or method'», «type 'float'», 
«type 'float'»] 


既然 我 们 知道 了 一 个 复数 有 什么 样 的 属性 ， 我 们 就 可 以 访问 它 的 数据 属性 ， 调 用 它 的 方法 
Ti 
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555 x.1mag 
i «UU 
>>> &.real 
bep 


>>> x.conjugate () 
[i21] 


试 着 访问 _dict 会 失败 ， 因 为 在 内 建 类 型 中 ， 不 存在 这 个 属性 : 
PON X. et 
Traceback (innermost last): 
Pil& "SEGiNeU line 1. iH 7? 


AttributeError: dict 


13.6.5 ”实例 属性 vs 类 属性 


我 们 已 在 13.4.1 节 中 描述 了 类 数据 属性 。 这 里 简要 提 一 下 ， 类 属性 仅 是 与 类 相关 的 数据 值 ， 和 
实例 属性 不 同 ， 类 属性 和 实例 无 关 。 这 些 值 像 静态 成 员 那 样 被 引用 ， 即 使 在 多 次 实例 化 中 调 
用 类 ， 它 们 的 值 都 保持 不 变 。 不 管 如 何 ， 静 态 成 员 不 会 因为 实例 而 改变 它们 的 值 ， 除 非 实 例 
中 显 式 改变 它们 的 值 (实例 属性 与 类 属性 的 比较 ， 类 似 于 自动 变量 和 静态 变量 ， 但 这 只 是 笼 
统 的 类 推 。 在 你 对 自动 变量 和 静态 变量 还 不 是 很 熟 的 情况 下 ， 不 要 深究 这 些 ) o 


类 和 实例 都 是 名 字 空 间 。 类 是 类 属性 的 名 字 空 间 ， 实 例 则 是 实例 属性 的 。 


关于 类 属性 和 实例 属性 ， 还 有 一 些 方面 需要 指出 。 你 可 采用 类 来 访问 类 属性 ， 如 果实 例 没 有 
同名 的 属性 的 话 ， 你 也 可 以 用 实例 来 访问 。 


1. 访问 类 属性 


类 属性 可 通过 类 或 实例 来 访问 。 下 面 的 示例 中 ， 类 C 在 创建 时 ， 带 一 个 version 属 性 ， 这 样 通 
过 类 对 象 来 访问 它 是 很 自然 的 了 ， 比 如 C.version。 当 实例 c 被 创建 后 ， 对 实例 C 而 言 ， 访 问 
c.Version 会 失败 ， 不 过 Python 首先 会 在 实例 中 搜索 名 字 version， 然 后 是 类 ， 再 就 是 继承 树 中 
的 基 类 。 本 例 中 ，version 在 类 中 被 找到 了 : 


>>> class C(object): # 定义 类 
version = 1.2 # ”静态 成 员 
>>> c = C() # ”实例 化 
>>> C.version # 通过 类 来 访问 
Lax 
»»» c.version # ”通过 实例 来 访问 
Lo 
»»» C.version *- 0.1 # 通过 类 (只 能 这 样 ) 来 更 新 
>>> C.version # 类 访问 
>>> c.version # ”实例 访问 它 ， 其 值 已 被 改变 
1.3 


然而 ， 我 们 只 有 当 使 用 类 引用 version 时 ， 才 能 更 新 它 的 值 ， 像 上 面 的 C.version 递 增 语句。 如 

尝试 在 实例 中 设 定 或 更 新 类 属性 会 创建 一 个 实例 属性 c.version， 后 者 会 阻止 对 类 属性 
C.versioin 的 访问 ， 因 为 第 一 个 访问 的 就 是 c.version， 这 样 可 以 对 实例 有 效 地 “遮蔽 ?类 属性 
C.version， 直 到 c.version 被 清除 掉 。 


2. 从 实例 中 访问 类 属性 须 谨 懂 


与 通常 Python 变量 一 样 ， 任 何 对 实例 属性 的 赋值 都 会 创建 一 个 实例 属性 〈 如 果 不 存 在 的 话 ) 
并 且 对 其 赋值 。 如 果 类 属性 中 存在 同名 的 属性 ， 有 趣 的 副作用 即 产 生 (经 典 类 和 新 式 类 都 存 
在 ) 。 


>>> class Foo(object): 
xl 


>>> foo = Foo() 


>>> foo.x 


»»» foo.x = 1.7 # 试 着 更 新 类 属性 

>>> foo.x # 现在 看 起 来 还 不 错 
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»»» Foo.x # 了 呵呵， 没有 变 ， 只 是 创建 了 一 个 新 的 实例 属性 
Ls 


在 上 面 的 代码 片段 中 ， 创 建 了 一 个 名 为 version 的 新 实例 属性 ， 它 覆盖 了 对 类 属性 的 引用 。 然 
而 ， 类 属性 本 身 并 没有 受到 伤害 ， 仍 然 存 在 于 类 域 中 ， 还 可 以 通过 类 属性 来 访问 它 ， 如 上 例 
可 以 看 到 的 。 好 了 ， 那 么 如 果 把 这 个 新 的 version 删 除 掉 ， 会 怎么 样 呢 ? 为 了 找到 结论 ， 我 们 
将 使 用 del 语 名 删除 c.version ° 


>>> del foo.x # ”删除 实例 属性 
>>> foo.x # 又 可 以 访问 到 类 属性 
Las 


所 以 ， 给 一 个 与 类 属性 同名 的 实例 属性 赋值 ， 我 们 会 有 效 地 “隐藏 "类 属性 ， 但 一 旦 我 们 删除 了 
这 个 实例 属性 ， 类 属性 又 重见天日 。 现 在 再 来 试 着 更 新 类 属性 ， 但 这 次 ， 我 们 只 尝试 一 下 “无 
部 "的 增 量 动作 : 


>>> foo.x += .2 # ” 试 着 增加 类 属性 


>>> fOO.X 


I3 
>>> Foo.x # mmj, JH 
la 


还 是 没 变 。 我 们 同样 创建 了 一 个 新 的 实例 属性 ， 类 属性 原封 不 动 〈 深 入 理解 Python 相关 知 
识 : 属性 已 存 于 类 字典 [_dict _] 中 。 通 过 赋值 ， 其 被 加 入 到 实例 的 _dict PT) 。 赋 值 语 
名 右边 的 表达 式 计算 出 原 类 的 变量 ， 增 加 0.2， 并 且 把 这 个 值 贼 给 新 创建 的 实例 属性 。 注 意 下 
面 是 一 个 等 价 的 赋值 方式 ， 但 它 可 能 更 加 清楚 些 : 
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foOO.x = Fóo.X + 0-2 
但 ...... 在 类 属性 可 变 的 情况 下 ， 一 切 都 不 同 了 : 


>>> class Foo(object): 
T x = (2003: 'poe2'] 


>>> foo = Foo() 

>>> fOO.X 

(2003: 'poe2'] 

>>> foo.x[2004] = 'valid path! 


222 foo.x 

(2003: 'poe2', 2004: 'valid path') 

>>> Foo.x # ”生效 了 ! 

(2003: 'poe2', 2004: "valid patnh'] 

>>> del foo.x WURST LAS SERM ER 


Traceback (most recent call last): 
File "«stdin»", line 1, in ? 
del foo.x 
AttributeError: x 


>>> 


3. 类 属性 持久 性 


静态 成 员 ， 顾 名 思 义 ， 任 赁 整个 实例 (及 其 属性 ) 的 如 何 进展 ， 它 都 不 理 不 皮 (因此 独立 于 
实例 ) 。 同 时 ， 当 一 个 实例 在 类 属性 被 修改 后 才 创 建 ， 那 么 更 新 的 值 就 将 生效 。 类 属性 的 修 
改 会 影响 到 所 有 的 实例 : 
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>>> class C(object): 


spam = 100 # 类 属性 
>>> cl = C() # 创建 一 个 实例 
>>> cl.spam # 通过 实例 访问 类 属性 
100 
>>> C.spam += 100 # 更 新 类 属性 
>>> C.spam # 查看 属性 值 改变 
200 
>>> cl.spam # 在 实例 中 验证 属性 值 改 变 
200 
>>> c2 = C() & 创建 另 一 个 实例 
»»» c2.spam # 验证 类 属性 
200 
>>> del cl # 删除 一 个 实例 
>>> C.spam += 200 # 再 次 更 新 类 属性 
>>> c2.spam # 验证 那个 属性 值 改 变 
400 





核心 提示 : 使 用 类 属性 来 修改 自身 (不 是 实例 属性 ) 


正如 上 面 所 看 到 的 那样 ， 使 用 实例 属性 来 试 着 修改 类 属性 是 很 危险 的 。 原 因 在 于 实例 拥有 它 
们 自己 的 属性 集 ， 在 Python 中 没有 明确 的 方法 来 指示 你 想 要 修改 同名 的 类 属性 ， 比 如 ， 没 有 
global 关 键 字 可 以 用 来 在 一 个 函数 中 设置 一 个 全 局 变量 (来 代替 同名 的 局 部 变量 ) 。 修 改 类 属 
性 需要 使 用 类 名 ， 而 不 是 实例 名 。 


13.7. 绑 定 和 方法 调用 


现在 我 们 需要 再 次 阅 述 Python 中 绑 定 (binding) 的 概念 ， 它 主要 与 方法 调用 相关 连 。 我 们 先 
来 回顾 一 下 与 方法 相关 的 知识 。 首 先 ， 方 法 仅仅 是 类 内 部 定义 的 函数 (这 意味 着 方法 是 类 属 
性 而 不 是 实例 属性 ) 。 


其 次 ， 方 法 只 有 在 其 所 属 的 类 拥有 实例 时 ， 才 能 被 调用 。 当 存在 一 个 实例 时 ， 方 法 才 被 认为 
是 绑 定 到 那个 实例 了 。 没 有 实例 时 方法 就 是 未 绑 定 的 。 


最 后 ， 任 何 一 个 方法 定义 中 的 第 一 个 参数 都 是 变量 self， 它 表示 调用 此 方法 的 实例 对 象 。 


核心 笔记 : self 是 什么 ? 


self 变 量 用 于 在 类 实例 方法 中 引用 方法 所 绑 定 的 实例 。 因 为 方法 的 实例 在 任何 方法 调用 中 总 是 
作为 第 一 个 参数 传递 的 ，self 被 选中 用 来 代表 实例 。 你 必须 在 方法 声明 中 放 上 self (你 可 能 已 
经 注意 到 了 这 点 ) ， 但 可 以 在 方法 中 不 使 用 实例 (self) 。 如 果 你 的 方法 中 没有 合用 到 self， 
那么 请 考虑 创建 一 个 常规 函数 ， 除 非 你 有 特别 的 原因 。 毕 竞 ， 你 的 方法 代码 没有 使 用 实例 ， 
没有 与 类 关联 其 功能 ， 这 使 得 它 看 起 来 更 像 一 个 常规 函数 。 在 其 他 面向 对 象 语言 中 ，self 可 能 
被 称 为 this。 


13.7.1 调用 绑 定 方法 


方法 ， 不 管 绑 定 与 否 ， 都 是 由 相同 的 代码 组 成 的 。 唯 一 的 不 同 在 于 是 否 存在 一 个 实例 可 以 调 
用 此 方法 。 在 很 多 情况 下 ， 程 序 员 调用 的 都 是 一 个 绑 定 的 方法 。 假 定 现在 有 一 个 MyClass 类 和 
此 类 的 一 个 实例 mc， 而 你 想 调用 MyClass.foo() 方 法 。 因 为 已 经 有 一 个 实例 ， 你 只 需要 调用 
mc.foo() 就 可 以 。 记 得 self 在 每 一 个 方法 声明 中 都 是 作为 第 一 个 参数 传递 的 。 当 你 在 实例 中 调 
用 一 个 绑 定 的 方法 时 ，self 不 需要 明确 地 传 入 了 。 这 算是 “必须 声明 self 作 为 第 一 个 参数 "对 你 的 
报酬 。 当 你 还 没有 一 个 实例 并 且 需 要 调用 一 个 非 绑 定 方法 的 时 候 你 必须 传递 self 参 数 。 


13.7.2 ”调用 非 绑 定 方法 


调用 非 绑 定 方法 并 不 经 常用 到 。 需 要 调用 一 个 还 没有 任何 实例 的 类 中 的 方法 的 一 个 主要 的 场 
景 是 : 你 在 派生 一 个 子 类 ， 而 且 你 要 履 盖 父 类 的 方法 ， 这 时 你 需要 调用 那个 父 类 中 想 要 敌 盖 
掉 的 构造 方法 。 这 里 是 一 个 本 章 前 面 介绍 过 的 例子 : 


class EmplAddrBookEntry (AddrBookEntry): 


'Employee Address Book Entry class' # 员工 地 址 记录 条 目 
def init (self, nm, ph, em): 
AddrBookEntry. init (self, nm, ph) 
self.empid = id 
self.email - em 


EmplAddrBookEntry 是 AddrBookEntry 的 子 类 ， 我 们 重 载 了 构造 器 _init (° ATAT AE Z 
地 重用 代码 ， 而 不 是 去 从 父 类 构造 器 中 剪 切 ， 粘 贴 代码 。 这 样 做 还 可 以 避免 bug 传 播 ， 因 为 任 
何 修复 都 可 以 传递 给 子 类 。 这 正 是 我 们 想 要 的 一 一 没有 必要 一 行 一 行 地 复制 代码 。 只 需要 能 
够 调用 父 类 的 构造 器 即 可 ， 但 该 怎么 做 呢 ? 


我 们 在 运行 时 没有 AddrBookEntry 的 实例 。 那 么 我 们 有 什么 呢 ? 我们 有 一 个 
EmplAddrBookEntry 的 实例 ， 它 与 AddrBookEntry 是 那样 地 相似 ， 我 们 难道 不 能 用 它 代 替 呢 ? 
当然 可 以 |! 


当 一 个 EmplAddrBookEntry 被 实例 化 ， 并 且 调 用 init () 时 ， 其 与 AddrBookEntry 的 实例 只 有 
很 少 的 差别 ， 主 要 是 因为 我 们 还 没有 机 会 来 自 定 义 我 们 的 EmplAddrBookEntry 实 例 ， 以 使 它 
与 AddrBookEntry 不 同 。 


这 是 调用 非 绑 定 方法 的 最 佳 地 方 了 。 我 们 将 在 子 类 构造 器 中 调用 父 类 的 构造 器 并 且 明 确 地 传 
递 ( 父 类 ) 构造 器 所 需要 的 self 参 数 (因为 我 们 没有 一 个 父 类 的 实例 ) 。 子 类 中 init () 的 第 
一 行 就 是 对 父 类 init () 的 调用 。 我 们 通过 父 类 名 来 调用 它 ， 并 且 传 递 给 它 self 和 其 他 所 需要 
的 参数 。 一 旦 调用 返回 ， 我 们 就 能 定义 那些 与 父 类 不 同 的 仅 存 在 我 们 的 〈 子 ) 类 中 的 ( 实 
例 ) 定制 。 


13.8 静态 方法 和 类 方法 


静态 方法 和 类 方法 在 Python 2.2 中 被 引入 。 经 典 类 及 新 式 (new-style) 类 中 都 可 以 使 用 它 
一 对 内 建 函 数 被 引入 ， 用 于 将 作为 类 定义 的 一 部 分 的 某 一 方法 声明 “标记 ”(tag) , “强制 类 型 
转换 ”(cast) 或 者 "转换 ”(convert) 为 这 两 种 类 型 的 方法 之 一 。 


o 


刑 


如 果 你 有 一 定 的 C++ 或 者 Java 经 验 ， 静 态 方法 和 这 些 语言 中 的 是 一 样 的 。 它 们 仅 是 类 中 的 函 

A (不 需要 实例 ) 。 事 实 上 ， 在 静态 方法 加 入 到 Python 之 前 ， 用 户 只 能 在 全 局 名 字 空 间 中 创 

建 函 数 ， 作 为 这 种 特性 的 替代 实现 一 有 时 在 这 样 的 函数 中 使 用 类 对 象 来 操作 类 (或 者 是 类 
属性 ) 。 使 用 模块 函数 比 使 用 静态 类 方法 更 加 常见 


回忆 一 下 ， 通 常 的 方法 需要 一 个 实例 (self) 作为 第 一 个 参数 ， 并 且 对 于 (AE 6g) 方法 调用 
来 说 ，self 是 自动 传递 给 这 个 方法 的 。 而 对 于 类 方法 而 言 ， 需 要 类 而 不 是 实例 作为 第 一 个 参 
数 ， 它 是 由 解释 器 传 给 方法 。 类 不 需要 特别 地 命名 ， 类 似 self， 不 过 很 多 人 使 用 cls 作 为 变量 名 
字 。 


13.8.4 staticmethod() 和 classmethod() 内 建 函 数 


现在 让 我 们 看 一 下 在 经 典 类 中 创建 静态 方法 和 类 方法 的 一 些 例子 (你 也 可 以 把 它们 用 在 新 式 
类 中 ) : 
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class TestStaticMethod: 
def foo(): 
print 'calling static method foo()' 


foo = staticmethod(foo) 


class TestClassMethod: 
def foo(cls): 
print 'calling class method foo()' 


print 'foo() is part of class:', cls. name 


foo = classmethod (foo) 

对 应 的 内 建 函 数 被 转换 成 它们 相应 的 类 型 ， 并 且 重 新 赋值 给 了 相同 的 变量 名 。 如 果 没 有 调用 
这 两 个 函数 ， 二 者 都 会 在 Python 编译 器 中 产生 错误 ， 显 示 需 要 带 self 的 常规 方法 声明 。 现 在 ， 
我 们 可 以 通过 类 或 者 实例 调用 这 些 函 数 ， 这 没什么 不 同 : 

>>> tsm = TestStaticMethod() 

>>> TestStaticMethod.foo() 

calling static method foo() 

>>> tsm.foo() 

calling static method foo() 

2» 

>>> tcm = TestClassMethod() 

>>> TestClassMethod.foo() 

calling class method foo() 

foo() is part of class: TestClassMethod 

>>> tcm.foo() 

calling class method foo() 


foo() is part of class: TestClassMethod 


13.8.2 ”使 用 有 函数 修饰 符 
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现在 ， 看 到 像 foo=staticmethod (foo) 这 样 的 代码 会 刺激 一 些 程序 员 。 很 多 人 对 这 样 一 个 没 

意义 的 语法 感到 心烦 ， 即 使 van Rossum 曾 指出 过 ， 它 只 是 临时 的 ， 有 待 社区 对 些 语义 进行 处 
理 。 在 第 11 章 的 11.3.6 节 中 ， 我 们 了 解 了 函数 修饰 符 ， 一 种 在 Python2.4 中 加 入 的 新 特征 。 你 
可 以 用 它 把 一 个 阴 数 应 用 到 另 个 函数 对 象 上 ， 而 且 新 函数 对 象 依 然 绑 定 在 原来 的 变量 。 我 们 

正 是 需要 它 来 整理 语法 。 通 过 使 用 解构 器 ， 我 们 可 以 避免 像 上 面 那 样 的 重新 赋值 : 


class TestStaticMethod: 
@staticmethod 
def foo(): 


print 'calling static method foo() 


class TestClassMethod: 
Gclassmethod 
def foo(cls): 
print 'calling class method foo()' 


print 'foo() is part of class:', cls. name 


13.9 组 合 


一 个 类 被 定义 后 ， 目 标 就 是 要 把 它 当 成 一 个 模块 来 使 用 ， 并 把 这 些 对 象 奏 入 到 你 的 代码 中 
去 ， 同 其 他 数据 类 型 及 逻辑 执行 流 混合 使 用 。 有 两 种 方法 可 以 在 你 的 代码 中 利用 类 。 第 一 种 
是 组 合 (composition) 。 就 是 让 不 同 的 类 混合 并 加 入 到 其 他 类 中 ， 来 增加 功能 和 代码 重用 
性 。 你 可 以 在 一 个 大 点 的 类 中 创建 你 自己 的 类 的 实例 ， 实 现 一 些 其 他 属性 和 方法 来 增强 对 原 
来 的 类 对 象 。 另 一 种 方法 是 通过 派生 ， 我 们 将 在 下 一 节 中 讨论 它 。 


举例 来 说 ， 让 我 们 想象 一 个 对 本 章 一 开始 创建 的 地 址 本 类 的 加 强 性 设计 。 如 果 在 设计 的 过 程 
中 ， 为 names、addresses 等 创建 了 单独 的 类 ， 那 么 最 后 我 们 可 能 想 把 这 些 工作 集成 到 
AddrBookEntry 类 中 去 ， 而 不 是 重新 设计 每 一 个 需要 的 类 。 这 样 就 节省 了 时 间 和 精力 ， 而 且 最 
后 的 结果 是 容易 维护 的 代码 一 ”一 块 代码 中 的 bug 被 修正 ， 将 反映 到 整个 应 用 中 。 


这 样 的 类 可 能 包含 一 个 Name 实 例 ， 以 及 其 他 如 StreetAddress、Phone (home ` work ` 
telefacsimile、pager、mobile 等 ) 、Email (home、work 等 ) ， 还 可 能 需要 一 些 Date 实 例 
(birthday、wedding、anniversary 等 ) 。 下 面 是 一 个 简单 的 例子 : 


class NewAddrBookEntry (object): # ”类 定义 


'new address book entry class' 


def init (self, nm, ph): # ”定义 构造 器 
self.name = Name (nm) # ”创建 Name 实例 
self.phone = Phone (ph) # 创建 Phone 实例 


print 'Created instance for:', self.name 


NewAddrBookEntry 类 由 它 自身 和 其 他 类 组 合 而 成 。 这 就 在 一 个 类 和 其 他 组 成 类 之 间 定 义 了 一 
种 “有 一 个 ”(has-a) 的 关系 。 比 如 ， 我 们 的 NewAddrBookEntry 类 “有 一 个 ”Name 类 实例 和 一 
个 Phone 实 例 。 


创建 复合 对 象 就 可 以 实现 这 些 附加 的 功能 ， 并 且 很 有 意义 ， 因 为 这 些 关 都 不 相同 。 每 一 个 类 
管理 它们 自己 的 名 字 空间 和 行为 。 不 过 当 对 象 之 间 有 更 接近 的 关系 时 ， 派 生 的 概念 可 能 对 你 
的 应 用 程序 来 说 更 有 意义 ， 特 别 是 当 你 需要 一 些 相似 的 对 象 ， 但 却 有 少许 不 同 功能 的 时 候 。 


13.10 于 类 和 派生 


当 类 之 间 有 显著 的 不 同 ， 并 且 〈 较 小 的 类 ) 是 较 大 的 类 所 需要 的 组 件 时 ， 组 合 表现 得 很 好 ， 
但 当 你 设计 “相同 的 类 但 有 一 些 不 同 的 功能 "时 ， 派 生 就 是 一 个 更 加 合理 的 选择 了 。 


OOP 的 更 强大 功能 之 一 是 能 够 使 用 一 个 已 经 定义 好 的 类 ， 扩 展 它 或 者 对 其 进行 修改 ， 而 不 会 
影响 系统 中 使 用 现存 类 的 其 他 代码 片段 。OOD 人 允许 类 特征 在 子孙 类 或 子 类 中 进行 继承 。 这 些 
子 类 从 基 类 (或 称 祖先 类 、 超 类 ) 继承 它们 的 核心 属性 。 而 且 ， 这 些 派生 可 能 会 扩展 到 多 
代 。 在 一 个 层次 的 派生 关系 中 的 相关 类 (或 者 是 在 类 树 图 中 重 直 相 邻 ) 是 父 类 和 子 类 关系 。 
从 同一 个 父 类 派生 出 来 的 这 些 类 (或 者 是 在 类 树 图 中 水 平 相 邻 ) 是 同胞 关系 。 父 类 和 所 有 高 
层 类 都 被 认为 是 祖先 。 


使 用 前 一 节 中 的 例子 ， 如 果 我 们 必须 创建 不 同类 型 的 地 址 本 ， 即 不 仅仅 是 创建 地 址 本 的 多 个 
实例 ， 在 这 种 情况 下 ， 所 有 对 象 几 乎 是 相同 的 。 如 果 我 们 希望 EmplAddrBookEntry 类 中 包含 
更 多 与 工作 有 关 的 属性 ， 如 员工 ID 和 电子 邮件 地 址 呢 ? 这 跟 PersonalAddrBookEntry 类 不 同 ， 
它 包含 更 多 基于 家 庭 的 信息 ， 比 如 家 庭 地 址 、 关 系 、 生 日 等 。 


两 种 情况 下 ， 我 们 都 不 想到 从 头 开始 设计 这 些 类 ， 因 为 这 样 做 会 重复 创建 通用 的 
AddressBook 类 时 的 操作 。 包 人 钨 AddressBook 类 所 有 的 特征 和 特性 并 加 入 需要 的 定制 特性 不 是 
很 好 吗 ? 这 就 是 类 派生 的 动机 和 要 求 。 


创建 子 类 


创建 子 类 的 语法 看 起 来 与 普通 (新式) 类 没有 区 别 ， 一 个 类 名 ， 后 跟 一 个 或 多 个 需要 从 其 中 
派生 的 父 类 : 
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class SubClassName (ParentClassl[, ParentClass2, ...]): 


'optional class documentation string' 


class suite 


如 果 你 的 类 没有 从 任何 祖先 类 派生 ， 可 以 使 用 object 作 为 父 类 的 名 字 。 经 典 类 的 声明 唯一 不 同 


之 处 在 于 其 没有 从 祖先 类 派生 一 此 时 ， 没 有 圆 括号 : 


class ClassicClassWithoutSuperclasses: 


pass 
至 此 ， 我 们 已 经 看 到 了 一 些 类 和 子 类 的 例子 ， 下 面 还 有 一 个 简单 的 例子 : 


class Parent (object): # 定义 父 类 
def parentMethod (self): 


print 'calling parent method' 


class Child(Parent): # ”定义 子 类 
def childMethod(self): 
print 'calling child method' 
>>> p = Parent() # ” 父 类 的 实例 
>>> p.parentMethod() 


calling parent method 


>>> 

>>> c = Child() # 子 类 的 实例 

>>> c.childMethod|() # ” 子 类 调用 它 的 方法 
calling child method 

>>> c.parentMethod() # ”调用 父 类 的 方法 


calling parent method 
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继承 描述 了 基 类 的 属性 如 何 “ 遗 传 "给 派生 类 。 一 个 子 类 可 以 继承 它 的 基 类 的 任何 属性 ， 不 管 是 
数据 属性 还 是 方法 。 


举 个 例子 如 下 。P 是 一 个 没有 属性 的 简单 类 。C 从 PP 继承 而 来 (因此 是 它 的 子 类 ) ， 也 没有 属 
性 : 


class P(object): # SS 
pass 
class C(P): & TX 
pass 
»»» c - CÜ # ”实例 化 子 类 
>>> c. class . 才子 类 “是 一 个 ” 父 类 
<class © main. .6C'» 
»»» C. bases # 子 类 的 父 类 


(«class ' main. .P'»,) 
因为 P 没 有 属性 ，C 没 有 继承 到 什么 。 下 面 我 们 给 P 添 加 一 些 属性 : 


class P: # 父 类 
"P class" 
def — init X (self): 
print 'created an instance of', \ 


self. class . name 


class C(P): # T% 


pass 


现在 所 创建 的 P 有 文档 字符 串 ( doc ) 和 构造 器 ， 当 我 们 实例 化 P 时 它 被 执行 ， 如 下 面 的 
交互 会 话 所 示 : 
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»»» p = P() # 父 类 实例 


created an instance of P 


55» p. - edlass.. # 显示 p 所 属 的 类 名 
«class ' main .P'» 

>>> P. bases. # RRIK 
(«type 'object'»,) 

»»» P. doc &oSONSBOCRCETUB 


'P class' 


"created an instance" 是 由 _init_() 直 接 输 出 的 。 我 们 也 可 显示 更 多 关于 父 类 的 信息 。 我 们 现 
在 来 实例 化 C， 展 示 _init () (构造 ) 方法 在 执行 过 程 中 是 如 何 继承 的 : 


>>> c = C1() # 子 类 实例 


created an instance of C 


>>> c. class _ # 显示 c 所 属 的 类 名 
«class ' main .C'» 

>>> C. bases _ # 子 类 的 父 类 
(«class ' main, .P'»,) 

555 Ce dóo E 子 类 的 文档 字符 串 
>>> 


C 没 有 声明 init _() 方 法 ， 然 而 在 类 C 的 实例 c 被 创建 时 ， 还 是 会 有 输出 信息 。 原 因 在 于 C 继 承 
了 P 的 _init ()。 bases _ 元 组 列 出 了 其 父 类 P。 需 要 注意 的 是 文档 字符 串 对 类 ， 函 数 / 方 
法 ， 还 有 模块 来 说 都 是 唯一 的 ， 所 以 特殊 属性 ”doc 不 会 从 基 类 中 继承 过 来 。 


13.11.1 ”bases\ 类 属性 


在 第 13.4.4 节 中 ， 我 们 概要 地 介绍 了 bases 类 属性 ， 对 任何 (F) 类 ， 它 是 一 个 包含 其 父 
X (parent) 的 集合 的 元 组 。 注 意 ， 我 们 明确 指出 “ 父 类 "是 相对 所 有 基 类 ( 它 包 括 了 所 有 祖先 
X) 而 言 的 。 那 些 没有 父 类 的 类 ， 它 们 的 ”bases 属性 为 空 。 下 面 我 们 看 一 下 如 何 使 用 

_ bases 的 。 


>>> class A(cbject): pass + 定义 类 及 


>>> class B(A): pass # A 的 子 类 


B 的 子 类 (x 的 间接 子 类 ) 


>>> class C(B): pass 


d 


>>> class D(A, B): pass & B 的 子 类 


>>> A. _bases_. 

(<type 'object'>,) 

>>> C. bases 

(«class _main__.B at 8120c90>,) 
>>> D. bases 


{<class main .A at 811fc90»5, <class main .B at 8120c90») 


在 上 面 的 例子 中 ， 尽 管 C 是 A 和 B 的 子 类 (通过 B 传 递 继承 关系 ) ， 但 C 的 父 类 是 B， 这 从 它 的 
声明 中 可 以 看 出 ， 所 以 ， 只 有 B 会 在 C. bases “中 显示 出 来 。 另 一 方面 ，D 是 从 两 个 类 A 和 B 
中 继承 而 来 的 (多重 继承 参见 13.11.4 节 ) 。 


13.11.2 ”通过 继承 覆盖 方法 
我 们 在 P 中 再 写 一 个 函数 ， 然 后 在 其 子 类 中 对 它 进行 覆盖 。 
class P(object): 


def foo(self): 
print 'Hi, I án P-foo()' 


>>> p = P() 
>>> p.foot) 


Hi, I am P-foo() 


现在 来 创建 子 类 Cj， 从 父 类 P 派 生 : 


class C(P): 
def foo(self): 
print "Hi; I am C-roo()' 


>>> CE = CI) 
>>> G.foOolt) 


Hi, I am C-foo() 


尽管 C 继 承 了 P 的 foo() 方 法 ， 但 因为 C 定 义 了 它 自己 的 foo() 方 法 ， 所 以 P 中 的 foo() 方 法 被 覆盖 
(Overrid) 。 禾 盖 方 法 的 原因 之 一 是 ， 你 的 子 类 可 能 需要 这 个 方法 具有 特定 或 不 同 的 功能 。 
所 以 ， 你 接 下 来 的 问题 肯定 是 :“ 我 还 能 否 调 用 那个 被 我 覆盖 的 基 类 方法 呢 ?” 


答案 是 肯定 的 ， 但 是 这 时 就 需要 你 去 调用 一 个 未 绑 定 的 基 类 方法 ， 明 确 给 出 子 类 的 实例 ， 例 


class C(P): 
def foo(self): 
P.foo(self) 
print 'Hi, I am C-foo()" 
注意 ， 我 们 上 面 已 经 有 了 一 个 P 的 实例 p， 但 上 面 的 这 个 例子 并 没有 用 它 。 我 们 不 需要 P 的 实例 


调用 P 的 方法 ， 因 为 已 经 有 一 个 P 的 子 类 的 实例 C 可 用 。 典 型 情况 下 ， 你 不 会 以 这 种 方式 调用 父 
类 方法 ， 你 会 在 子 类 的 重 写 方法 里 显 式 地 调用 基 类 方法 。 


class C(P): 
def foo(self): 
super(C, self).foo() 


peint 'Hi, I alm C-fo5()" 


注意 ， 在 这 个 〈 未 绑 定 ) 方法 调用 中 我 们 显 式 地 传递 了 self。 一 个 更 好 的 办 法 是 使 用 Super() 内 
建 方法 : 
class P(object): 
def — init (self): 
print "calling P's constructor" 
class C(P): 
def init (self): 
print "calling C's constructor" 


super() 不 但 能 找到 基 类 方法 ， 而 且 还 为 我 们 传 进 self， 这 样 我 们 就 不 需要 做 这 些 事 了 。 现 在 我 
们 只 要 调用 子 类 的 方法 ， 它 会 帮 你 完成 一 切 : 


>>> c = C() 
»»^» g.root) 
Hi, I am P-roolt) 
Hi, lI am C-foo(t) 


核心 笔记 : ER _init 不 会 自动 调用 基 类 的 init [| 
类 似 于 上 面 的 覆盖 非特 殊 方 法 ， 当 从 一 个 带 构 造 器 dni () 的 类 派生 ， 如 果 你 不 去 覆盖 
jnit _() ， 它 将 会 被 继承 并 自动 调用 。 但 如 果 你 在 子 类 中 覆盖 了 init ()， 子 类 被 实例 化 
时 ， 基 类 的 ”init () 就 不 会 被 自动 调用 。 这 可 能 会 让 了 解 Java 的 朋友 感到 吃惊 。 


class P(object): 
def init (self): 
print "calling P's constructor" 
class C(P): 
def init (seit): 


print "calling C's constructor" 


»»5» 6 = crt) 


calling C's constructor 


如 果 你 还 想 调用 基 类 的 ”init ()， 你 需要 像 上 边 我 们 刚 说 的 那样 ， 明 确 指 出 ， 使 用 一 个 子 类 
的 实例 去 调用 基 类 (GRADE) 方法 。 相 应 地 更 新 类 C， 会 出 现下 面 预期 的 执行 结果 : 
class C(P): 
def init (self): 
E... init X [selr) 


print "calling C's constructor" 


>>> c = C() 
calling P's constructor 


calling C's constructor 


上 边 的 例子 中 ， 子 类 的 ”init () 方 法 首先 调用 了 基 类 的 _init _() 方 法 。 这 是 相当 普遍 (不 是 
强制 ) 的 做 法 ， 用 来 设置 初始 化 基 类 ， 然 后 可 以 执行 子 类 内 部 的 设置 。 这 个 规则 之 所 以 有 意 
义 的 原因 是 ， 你 希望 被 继承 的 类 的 对 象 在 子 类 构造 器 运行 前 能 够 很 好 地 被 初始 化 或 作 好 准备 
工作 ， 因 为 它 (FX) 可 能 需要 或 设置 继承 属性 。 对 C++ 熟悉 的 朋友 ， 可 能 会 在 派生 类 构造 器 
声明 时 ， 通 过 在 声明 后 面 加 上 冒号 和 所 要 调用 的 所 有 基 类 构造 器 这 种 形式 来 调用 基 类 构造 

器 。 而 在 Java 中 ， 不 管 程序 员 如 何 处 理 ， 子 类 构造 器 都 会 去 调用 基 类 的 构造 器 。 


Python 使 用 基 类 名 来 调用 类 方法 ， 对 应 在 Java 中 ， 是 用 关键 字 Super 来 实现 的 ， 这 就 是 Super() 
内 建 函 数 引入 到 Python 中 的 原因 ， 这 样 你 就 可 以 “ 依 戎 芦 画 肚 " 了 : 


class C(P): 
def init (self): 
super(C, self). init.  () 


print "calling C's constructor" 


使 用 super() 的 漂亮 之 处 在 于 ， 你 不 需要 明确 给 出 任何 基 类 名 字 ......“ 跑 腿 儿 "的 事 ， 它 帮 你 干 
了 ! 使 用 super() 的 重点 ， 使 你 不 需要 明确 提供 父 类 。 这 意味 着 如 果 你 改变 了 类 继承 关系 ， 你 
只 需要 改 一 行 代码 (class 语句 本 身 ) 而 不 必 在 大 量 代码 中 去 查找 所 有 被 修改 的 那个 类 的 名 
字 。 


13.11.3 ”从 标准 类 型 派生 


经 典 类 中 ， 一 个 最 大 的 问题 是 ， 不 能 对 标准 类 型 进行 子 类 化 。 幸 运 的 是 ， 在 2.2 以 后 的 版 本 
中 ， 随 着 类 型 (types) 和 类 (class) 的 统一 和 新 式 类 的 引入 ， 这 一 点 已 经 被 修正 。 下 面 ， 介 
绍 两 个 子 类 化 Python 类 型 的 相关 例子 ， 其 中 一 个 是 可 变 类 型 ， 另 一 个 是 不 可 变 类 型 。 


1. 不 可 变 类 型 的 例子 


假定 你 想 在 金融 应 用 中 ， 应 用 一 个 处 理 浮 点 型 的 子 类 。 每 次 你 得 到 一 个 货币 值 ( 浮 点 型 给 
人 
类 型 来 说 是 个 用 来 精确 保育 兆 点 值 的 更 住 方案 ， 但 你 还 是 需要 [有 时 候 ] 对 其 进行 合 入 操作 ! ) 
你 的 类 开始 可 以 这 样 写 


class RoundFloat (float): 
def new (cls, val): 


return float. new . (cls, round(val, 2)) 


A414 x 1 ^ new __() 特 殊 方 法 来 定制 我 们 的 对 象 ， 使 之 和 标准 Python 浮 点 型 (float) 有 一 些 
区 别 : 我 们 使 用 round() 内 建 函 数 对 原 浮 点 型 进行 舍 入 操作 ， 然 后 实例 化 我 们 的 float， 
RoundFloat。 我 们 是 通过 调用 父 类 的 构造 器 来 创建 丨 实 的 对 象 的 ，float anew) 。 注 意 ， 所 
459) new __() 方 法 都 是 类 方法 ， 我 们 要 显 式 地 传 入 类 作为 第 一 个 参数 ， 这 类 似 于 常见 的 方法 
如 _init_() 中 需要 的 Self 。 


现在 的 例子 还 非常 简单 ， 比 如 ， 我 们 知道 有 一 个 float， 我 们 仅仅 是 从 一 种 类 型 中 派生 而 来 等 。 

ee 
面 ， 对 它 进行 这 方面 的 修改 : 

class RoundFloat(fioat): 


def new (cls, * 


return super(RoundFloat, cls). new (cls, round(val, 2)) 


这 个 例子 还 远 不 够 完整 ， 所 以 ， 请 留意 本 章 我 们 将 使 它 有 更 好 的 表现 。 下 面 是 一 些 样 例 输 
出 : 


>>> RoundFloat (1.5955) 
140 
>>> RoundFloat (1.5945) 
1,99 
»»» RoundFloat(-l.9955) 
= a 


2. 可 变 类 型 的 例子 


子 类 化 一 个 可 变 类 型 与 此 类 似 ， 你 可 能 不 需要 使 用 _new — oe init (Q) ， 因 为 通常 
设置 不 多 。 一 般 情 况 下 ， ee 你 想 要 的 。 下 例 中 ， 我 们 简单 地 
创建 一 个 新 的 字典 类 型 ， 它 的 keys() 方 法 会 自动 排序 结 


class SortedKeyDict (dict): 
def keys (self): 


return sorted(super( SortedKeyDict, self).keys()) 


回忆 一 下 ， 字 典 (dictionary) "I zt &dict() ` dict (mapping) ^ 
dict (sequence of 2 tuples) 或 dict (**kwargs) 来 创建 ， 看 看 下 面 使 用 新 类 的 例子 : 


d « SortedKeyDict((('zheng-cai', 67), ('hui-jun', 68),('xin-yi', 2))) 
print 'By iterator:'.l1just(12), [key for key in d] 
print 'By keys():'.1just(12), d.keys() 


把 上 面 的 代码 全 部 加 到 一 个 脚本 中 ， 然 后 运行 ， 可 以 得 到 下 面 的 输出 : 
By iterator: ['zheng-cai', 'xin-yi', 'hui-jun'] 
By keys(): ['xin-yi', 'hui-jun', 'zheng-cai'] 


在 上 例 中 ， 通 过 keys 和 迭代 过 程 是 以 散 列 顺序 的 形式 ， 而 使 用 我 们 (€ 855) keys() 方 法 则 将 
keys 变 为 字母 排序 方式 了 。 


一 定 要 谨 懂 ， 而 且 要 意识 到 你 正在 干什么 。 如 果 你 说 "你 的 方法 调用 super() 过 于 复杂 ”， 取 而 代 
之 的 是 ， 你 更 喜欢 keys() 简 简单 单 〈 也 容 多 理解 ) ， 如 下 所 示 : 


def keys(self): 


return sorted(self.keys()) 
这 是 本 章 后 面 的 练习 13-19。 


13.11.4 多重 继 承 


同 C++ 一 样 ，Python 允 许 子 类 继承 多 个 基 类 。 这 种 特性 就 是 通常 所 说 的 多 重 继承 。 概 念 容 
易 ， 但 最 难 的 工作 是 ， 如 何 正确 找到 没有 在 当前 ( 子 ) 类 定义 的 属性 。 当 使 用 多 重 继承 时 ， 
有 两 个 不 同 的 方面 要 记 住 。 首 先 ， 还 是 要 找到 合适 的 属性 。 另 一 个 就 是 当 你 重 写 方法 时 ， 如 
何 调用 对 应 父 类 方法 以 "发挥 他 们 的 作用 ”， 同时， 在 子 类 中 处 理 好 自己 的 义务 。 我 们 将 讨论 两 
个 方面 ， 但 侧重 后 者 ， 讨 论 方法 解析 顺序 。 


1. 方法 解释 顺序 (MRO) 
在 Python 2.2 以 前 的 版 本 中 ， 算 法 非常 简单 : 深度 优先 ， 从 左 至 右 进 行 搜 索 ， 取 得 在 子 类 中 使 
用 的 属性 。 其 他 Python 算 法 只 是 覆盖 被 找到 的 名 字 ， 多 重 继 承 则 取 找 到 的 第 一 个 名 字 。 


由 于 类 ， 类 型 和 内 建 类 型 的 子 类 ， 都 经 过 全 新 改造 ， 有 了 新 的 结构 ， 这 种 算法 不 再 可 行 。 这 
样 一 种 新 的 MRO (Method Resolution Order) 算法 被 开发 出 来 ， 在 2.2 版 本 中 初次 登场 ， 是 
一 个 好 的 尝试 ， 但 有 一 个 缺陷 (看 下 面 的 核心 笔记 ) 。 这 在 2.3 版 本 中 立即 被 修改 ， 也 就 是 今 
天 还 在 使 用 的 版 本 。 


精确 顺序 解释 很 复杂 ， 超 出 了 本 文 的 范畴 ， 但 你 可 以 去 阅读 本 节 后 面 的 参考 书目 提 到 的 有 关 
内 容 。 这 里 提 一 下 ， 新 的 查询 方法 是 采用 广度 优先 ， 而 不 是 深度 优先 。 


核心 笔记 : Python 2.2 使 用 一 种 唯一 但 不 完善 的 MRO 


Python 2.2 是 首 个 使 用 新 式 MRO 的 版 本 ， 它 必须 取代 经 典 类 中 的 算法 ， 原 因 在 上 面 已 谈 到 
过 。 在 2.2 版 本 中 ， 算 法 基本 思想 是 根据 每 个 祖先 类 的 继承 结构 ， 编 译 出 一 张 列 表 ， 包 括 搜 索 
到 的 类 ， 按 策略 删除 重复 的 。 然 而 ， 在 Python 核心 开发 人 员 邮 件 列表 中 ， 有 人 指出 ， 在 维护 
单调 性 方面 失败 过 (顺序 保存 ) ， 必 须 使 用 新 的 C3 算法 蔡 换 ， 也 就 是 从 2.3 版 开始 使 用 的 新 算 
法 。 


下 面 的 示例 ， 展 示 经 典 类 和 新 式 类 中 ， 方 法 解释 顺序 有 什么 不 同 。 


2. 简单 属性 查找 示例 
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下 面 这 个 例子 将 对 两 种 类 的 方案 不 同 处 做 一 展示 。 脚 本 由 一 组 父 类 ， 一 组 子 类 ， 还 有 一 个 子 
孙 类 组 成 。 


class Pl: £(object): # 父 类 1 
def foo(self): 
print 'called Pl-foo()' 


class P2: &(object): & X2 
def foo(self): 
print 'called P2-foo()' 


def bar(self): 
print 'called P2-bar()' 


class Cl(Pl, P2): # 子 类 1， 从 P1，P2 派生 
pass 
class C2(Pl, P2): # 子 类 2， 从 Pl1，P2 派生 


def bar(self): 
print 'called C2-bar()' 


class GC(C1l, C2): # ”定义 子孙 类 
pass # 从 Cl，C2 派生 


在 图 13-2 中 ， 我 们 看 到 父 类 、 子 类 及 子孙 类 的 关系 。P1 中 定义 了 foo(), P2 定 义 了 foo() 和 
bar()，C2 定 义 了 bar()。 下 面 举例 说 明 一 下 经 典 类 和 新 式 类 的 行为 。 
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(foo) P1 P2 (foo, bar) 


C1 C2 (bar) 


图 13-2 父 类 ， 子 类 及 子孙 类 的 关系 图 ， 还 有 它们 各 自 定义 的 方法 
(1) 经 典 类 
首先 来 使 用 经 典 类 。 通 过 在 交互 式 解释 器 中 执行 上 面 的 声明 ， 我 们 可 以 验证 经 典 类 使 用 的 解 
释 顺 序 ， 深 度 优先 ， 从 左 至 右 : 


>>> gc = GC() 


>>> gc.foo() t GG = QI > Pi 
called Pl-foo() 
>>> gc.bar() EGC LI» Cl X PLI D P2 


called P2-bar() 
当 调 用 foo() 时 ， 它 首先 在 当前 类 (GC) 中 查找 。 如 果 没 找到 ， 就 向 上 查找 最 亲 的 父 类 ，C1。 
查找 未 遂 ， 就 继续 沿 树 上 访 到 父 类 P1,foo() 被 找到 。 
同样 ， 对 bar() 来 说 ， 它 通过 搜索 GC, C1, P1 然 后 在 P2 中 找到 。 因 为 使 用 这 种 解释 顺序 的 缘 
故 ，C2.bar() 根 本 就 不 会 被 搜索 了 。 
现在 ， 你 可 能 在 想 ，“ 我 更 愿意 调用 C2 的 bar() 方 法 ， 因 为 它 在 继承 树 上 和 我 更 亲近 些 ， 这 样 才 
会 更 合适 ”。 在 这 种 情况 下 ， 你 当然 还 可 以 使 用 它 ， 但 你 必须 调用 它 的 合法 的 全 名 ， 采 用 典型 
的 非 绑 定 方式 去 调用 ， 并 且 提 供 一 个 合法 的 实例 : 


>>> GZ. Dar (90) 
called C2-bar() 


(2) 新 式 类 


取消 类 P1 和 类 P2 疡 明 中 的 对 (object) 的 注释 ， 重 新 执行 一 下 。 新 式 方法 的 查询 有 一 些 不 
同 : 


>>> gc = GC() 


>>> gc.foo() # GC => Cl => C2 = P1 
called Pl1-foo() 
>>> gc.bar() t GC © Cl => C2 


called C2-bar() 


与 沿 着 继承 树 一 步 一 步 上 漳 不 同 ， 它 首先 查找 同胞 兄弟 ， 采 用 一 种 广度 优先 的 方式 。 当 查找 
foo()， 它 检查 GC， 然 后 是 C1 和 C2， 然 后 在 P1 中 找到 。 如 果 P1 中 没有 ， 查 找 将 会 到 达 P2 。 
foo() 的 底线 是 ， 包 括 经 典 类 和 新 式 类 都 会 在 P1 中 找到 它 ， 然 而 它们 虽然 是 同居 ， 但 殊 途 ! 


然而 ，bar() 的 结果 是 不 同 的 。 它 搜索 GC 和 C1， 紧 接着 在 C2 中 找到 了 。 这 样 ， 就 不 会 再 继续 
搜索 到 祖父 P1 和 P2。 这 种 情况 下 ， 新 的 解释 方式 更 适合 那 种 要 求 查找 GC 更 亲近 的 bar() 的 方 
案 。 当 然 ， 如 果 你 还 需要 调用 上 一 级 ， 只 要 按 前 述 方法 ， 使 用 非 绑 定 的 方式 去 做 ， 即 可 。 


>>> P2Z.barí(qo) 
called P2-bar() 


新 式 类 也 有 一 个 _mro 属性， 告诉 你 查找 顺序 是 怎样 的 : 


Ry GO. Juro 
(«class ' main .GC'», «class ' main. .Cl'», «class 
* man .02'», «class '. main .Pl'», «class 


' main .P2'», «type 'object'») 


3. * 凌 形 效应 引起 MRO 问 题 


经 典 类 方法 解释 不 会 带 来 很 多 问题 。 它 
继承 只 限 用 在 对 两 个 完全 不 相关 的 类 进行 


很 容易 解释 ， 并 理解 。 大 部 分 类 都 是 单 继承 的 ， 多 重 


日 

容易 

联合 。 这 就 是 术语 mixin 类 (或 者 "mix-ins”) 的 由 
为 什么 经 典 类 MRO 会 失败 


在 版 本 2.2 中 ， 类 型 与 类 的 统一 ， 带 来 了 一 个 新 的 “问题 *， 波 及 所 有 从 object (所 有 类 型 的 祖先 
X) 派生 出 来 的 ( 根 ) 类 ， 一 个 简单 的 继承 结构 变 成 了 一 个 次 形 。 从 Guido van Rossum 的 文 
章 中 得 到 下 面 的 灵感 ， 打 个 比方 ， 你 有 经 典 类 B 和 C, C 履 盖 了 构造 器 ，B 没 有 ，D 从 B 和 C 继 承 
而 来 : 


class B: 


pass 


class C: 
def init  |(self): 


print "the default constructor" 


class D(B, C): 


pass 


当 我 们 实例 化 D， 得 到 : 


>>> d = D() 


the default constructor 


El 13-375 B, C 和 D 的 类 继承 结构 ， 现 在 把 代码 改 为 采用 新 式 类 的 方式 ， 问 题 也 就 产生 了 : 


B G — B »C 


D D 
Classic New-style 
classes classes 


13-3 ”继承 的 问题 是 由 于 在 新 式 类 中 ， 需 要 出 现 基 类 ， 这 样 就 在 继承 


结构 中 ， 形 成 了 


一 个 鞭 形 。D 的 实例 上 溯 时 ， 不 应 当 错过 C， 但 不 能 两 次 上 溯 到 A (因为 B 和 C 都 从 A 派 
生 ) 。 去 读 读 贵 铎 . 范 : 罗 萨 姆 的 文章 中 有 关 * 协 作 方 法 "的 部 分 ， 可 以 得 到 更 深 地 理解 。 


class B(object): 


pass 


class C(object): 
def — init  J (self): 


print "the default constructor" 


a Lu o MU uU MM RM MEE 
A3 CERT SEXO: 真正 的 问题 就 存在 于 MRO 了 。 如 果 我 们 使 用 经 典 类 的 MRO， 当 实例 
化 D 时 ， 不 再 得 到 C.， int () 之 结果 ..... 而 是 得 到 object._init _() ! 这 就 是 为 什么 MRO 需 要 修 


gC 85 iR ERE o 


尽管 我 们 看 到 了 ， 在 上 面 的 例子 中 ， 类 GC 的 属性 查找 路 径 被 改变 了 ， 但 你 不 需要 担心 会 有 大 
还 有 ， 如 果 你 不 需 


量 的 代码 崩溃 。 经 典 类 将 沿用 老式 MRO ;而 新 式 类 将 使 用 它 自己 的 MRO。 
要 用 到 新 式 类 中 的 所 有 特性 ， 可 以 继续 使 用 经 典 类 进行 开发 ， 不 会 有 问题 的 。 


4. 总 结 
经 典 类 ， 使 用 深度 优先 算法 。 因 为 新 式 类 继承 自 object， 新 的 鞭 形 类 继承 结构 出 现 ， 问 题 也 就 


接着 而 来 了 ， 所 以 必须 新 建 一 个 MRO。 


你 可 以 在 下 面 的 链接 中 读 在 更 多 有 关 新 式 类 、MRO 的 文章 。 


Guido van Rossum 有 关 类 型 和 类 统一 的 文章 : 


http://www.python.org/download/releases/2.2.3/descrintro 
PEP 252 : 使 类 型 看 起 来 更 像 类 
http://www.python.org/doc/peps/pep-0252 

"Python 2.2 新 亮点 ?文档 
http://www.python.org/doc/2.2.3/whatsnew 

论文 : Python 2.3 方 法 解释 顺序 


http://python.org/download/releases/2.3/mro/ 


13.12 类、 实例 和 其 他 对 象 的 内 建 函 数 


13.12.1 issubclass() 


issubclass() 布 尔 泡 数 判 断 一 个 类 是 另 一 个 类 的 子 类 或 子孙 类 。 它 有 如 下 语法 : 


issubclass(sub, sup) 


issubclass() 返 回 True 的 情况 : 给 出 的 子 类 sub 确 实 是 父 类 sup 的 一 个 子 类 (反之 ， 则 为 
False) 。 这 个 函数 也 允许 “不 严格 "的 子 类 ， 意 味 着 ， 一 个 类 可 视 为 其 自身 的 子 类 ， 所 以 ， 这 
个 函数 如 果 当 sub 就 是 sup， 或 者 从 sup 派 生 而 来 ， 则 返回 True (一 个 “严格 的 " 子 类 是 严格 意义 
上 的 从 一 个 类 派生 而 来 的 子 类 ) o 


从 Python 2.3 开 始 ，issubclass() 的 第 二 个 参数 可 以 是 可 能 的 父 类 组 成 的 元 组 (tuple) ， 这 
时 ， 只 要 第 一 个 参数 是 给 定 元 组 中 任何 一 个 候选 类 的 子 类 时 ， 就 会 返回 True 。 


13.12.2 isinstance() 


isinstance() 布 尔 函 数 在 判定 一 个 对 象 是 否 是 另 一 个 给 定 类 的 实例 时 ， 非 常 有 用 。 它 有 如 下 语 
法 : 


isinstance(objl, obj2) 


isinstance() 在 obj1 是 类 obj2 的 一 个 实例 ， 或 者 是 obj2 的 子 类 的 一 个 实例 时 ， 返 回 True (反之 ， 
则 为 False) ， 看 下 面 的 例子 : 
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>>> class Cl(object): pass 


>>> class C2(object): pass 


>>> el = CIl() 

>>> c2 = C2() 

>>> isinstance(cl, CI) 
True 

>>> isinstance (c2, C1) 
False 


>>> isinstance(cl, C2) 

False 

>>> isinstance(c2, C2) 

True 

>>> isinstance(C2, c2) 

Traceback (innermost last): 

File "«stdin»", line 1l, in ? 

isinstance(C2, c2) 

TypeError: second argument must be a class 


注意 : 第 二 个 参数 应 当 是 类 ; 不 然 ， 你 会 得 到 一 个 TypeError。 但 如 果 第 二 个 参数 是 一 个 类 型 
对 象 ， 则 不 会 出 现 异 常 。 这 是 允许 的 ， 因 为 你 也 可 以 使 用 isinstance() 来 检查 一 个 对 象 obj1 是 
否 是 obj2 的 类 型 ， 比 如 : 

>>> isinstance(4, int) 

True 

>>> isinstance(4, str) 

False 

>>> i1sinstance('4', str) 

True 
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如 果 你 对 Java 有 一 定 的 了 解 ， 那 么 你 可 能 知道 Java 中 有 个 等 价 函 数 叫 instanceof()， 但 由 于 性 
能 上 的 原因 ，instanceof() 并 不 推荐 使 用 。 调 用 Python 的 isinstance() 不 会 有 性 能 上 的 问题 ， 主 
要 是 因为 它 只 用 来 快速 搜索 类 族 集 成 结构 ， 以 确定 调用 者 是 哪个 类 的 实例 ， 还 有 更 重要 的 
是 ， 它 是 用 C 写 的 |! 


同 issubclass() 一 样 ，isinstance() 也 可 以 使 用 一 个 元 组 作为 第 二 个 参数 。 这 个 特性 是 从 Python 
2.2 版 本 中 引进 的 。 如 果 第 一 个 参数 是 第 二 个 参数 中 给 定 元 组 的 任何 一 个 候选 类 型 或 类 的 实例 
时 ， 就 会 返回 True。 你 还 可 以 在 第 13.16.1 节 中 了 解 到 更 多 有 isinstance() 的 内 容 。 


13.12.3 hasattr() ^ getattr() ` setattr() ^ delattr() 


*attr() 系 列 函 数 可 以 在 各 种 对 象 下 工作 ， 不 限于 类 (cass) 和 实例 (instances) 。 然 而 ， 
为 在 类 和 实例 中 使 用 极其 频繁 ， 就 在 这 里 列 出 来 了 。 需 要 说 明 的 是 ， 当 使 用 这 些 函 数 时 ， 你 
传 入 你 正在 处 理 的 对 象 作为 第 一 个 参数 ， 但 属性 名 ， 也 就 是 这 些 函 数 的 第 二 个 参数 ， 是 这 些 
属性 的 字符 串 名 字 。 换 名 话说 ， 在 操作 obj.attr 时 ， 就 相当 于 调用 *attr (obj,attr...) 系列 函数 
一 一 下 面 的 例子 讲 得 很 清楚 。 

hasattr() 函 数 是 布朗 型 的 ， 它 的 目的 就 是 为 了 决定 一 个 对 象 是 否 有 一 个 特定 的 属性 ， 一 般 用 于 
访问 某 属 性 前 先 作 一 下 检查 。getattr() 和 setattr() 驾 数 相 应 地 取得 和 赋值 给 对 象 的 属性 ， 
getattr() 会 在 你 试图 读 取 一 个 不 存在 的 属性 时 ， 引 发 AttributeError 异 常 ， 除 非 给 出 那个 可 选 的 
软 认 参数 。setattr() 将 要 么 加 入 一 个 新 的 属性 ， 要 么 取代 一 个 已 存在 的 属性 。 而 delattr() 函 数 会 
从 一 个 对 但 中 删除 属性 。 


下 面 一 些 例子 使 用 到 了 *attr() 系 列 内 建 函 数 : 


>>> class myClass (object): 
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def — init (self): 
self.foo = 100 


>>> myInst = myClass() 

>>> hasattr(myInst, 'foo') 

True 

>>> getattr(myInst, 'foo') 

100 

>>> hasattr(myInst, "'bar') 

False 

>>> getattr(myInst, 'bar') 

Traceback (most recent call last): 
File "«stdin»", line 1l, in ? 

getattr(myInst, 'bar') 

AttributeError: myClass instance has no attribute 'bar' 

>>> getattr(c, 'bar', 'oops!"') 

'oops!' 

>>> setattr(myInst, 'bar', 'my attr') 


>>> dir (myInst) 


[* doc 'y " module '. 'bar', *foo'] 
>>> getattr(myInst, 'bar') HEF myInst.bar 
'my attr' 


>>> delattr(myInst, 'foo') 
>>> dir (myInst) 
['. doc. ', ' moduls Ty Thart] 


>>> hasattr(myInst, 'foo') 





False 


13.12.4 dir() 


前 面 用 到 dir() 是 在 练习 2-12、 练 习 2-13 和 练习 4-7。 在 这 些 练习 中 ， 我 们 用 dir() 列 出 一 个 模块 
所 有 属性 的 信息 。 现 在 你 应 该 知道 dir() 还 可 以 用 在 对 象 上 。 


在 Python 2.2 中 ，dir() 得 到 了 重要 的 更 新 。 因 为 这 些 改变 ， 那 些 _members 和 methods 数据 
属性 已 经 被 宣告 即将 不 支持 。dir() 提 供 的 信息 比 以 前 更 加 详尽 。 根 据 文档 ，“ 除 了 实例 变量 名 
和 常用 方法 外 ， 它 还 显示 那些 通过 特殊 标记 来 调用 的 方法 ， 像 _iadd (+=) > 

_len (len)) , ne _ (!=) ”。 在 Python 文档 中 有 详细 说 明 。 
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。 dir() 作 用 在 实例 上 (经 典 类 或 新 式 类 ) 时 ， 显 示 实 例 变 量 ， 还 有 在 实例 所 在 的 类 及 所 
有 它 的 基 类 中 定义 的 方法 和 类 属性 。 


e dir() 作 用 在 类 上 (经 典 类 或 新 式 类 ) 时 ， 则 显示 类 以 及 它 的 所 有 基 类 的 ”dict 中 的 
内 容 。 但 它 不 会 显示 定义 在 元 类 (metaclass) 中 的 类 属性 。 

e dir() 作 用 在 模块 上 时 ， 则 显示 模块 的 ”dict 的 内 容 。 (这 没 改动 ) 

e dir() 不 带 参 数 时 ， 则 显示 调用 者 的 局 部 变量 。 (也 没 改动 ) 。 关 于 更 多 细节 : 对 于 那 
X5 x 1  dict&Q class| 属性 的 对 象 ， 就 使 用 它们 ; 出 于 向 后 兼容 的 考虑 ， 如 果 
C, E31  membersfemethods ， 则 使 用 它们 。 





13.12.5 super() 


super() 函 数 在 Python2.2 版 本 新 式 类 中 引入 。 这 个 函数 的 目的 就 是 帮助 程序 员 找 出 相应 的 父 
类 ， 然 后 方便 调用 相关 的 属性 。 一 般 情 况 下 ， 程 序 员 可 能 仅仅 采用 非 绑 定 方式 调用 祖先 类 方 
法 。 使 用 Super() 可 以 简化 搜索 一 个 合适 祖先 的 任务 ， 并 且 在 调用 它 时 ， 替 你 传 入 实例 或 类 型 
对 象 。 


在 第 13.11.4 节 中 ， 我 们 描述 了 方法 解释 顺序 (MRO) ， 用 于 在 祖先 类 中 查找 属性 。 对 于 每 个 
定义 的 类 ， 都 有 一 个 名 为 “mro “的 属性 ， 它 是 一 个 元 组 ， 按 照 他 们 被 搜索 时 的 顺序 ， 列 出 
了 备 搜索 的 类 。 语 法 如 下 : 


super(type[, obj]) 


给 出 type,super()* 返 回 此 type 的 父 类 "”。 如 果 你 希望 父 类 被 绑 定 ， 你 可 以 传 入 obj 参 数 ( objs5 ft 
是 type 类 型 的 ) 。 否 则 父 类 不 会 被 绑 定 。obj 参 数 也 可 以 是 一 个 类 型 ， 但 它 应 当 是 type 的 一 个 
子 类 。 通 常 ， 当 给 出 obj 时 : 


e 如 果 obj 是 一 个 实例 ，isinstance (objtype) 就 必须 返回 True 
e 如 果 obj 是 一 个 类 或 类 型 ，issubclass (objtype) 就 必须 返回 True 


事实 上 ，super() 是 一 个 工厂 函数 ， 它 创造 了 一 个 super object， 为 一 个 给 定 的 类 使 用 mro — 
去 查找 相应 的 父 类 。 很 明显 ， 它 从 当前 所 找到 的 类 开始 搜索 MRO。 更 多 详情 ， 请 再 看 一 下 贵 
铎 : 范 : 罗 萨 姆 有 关 统 一 类 型 和 类 的 文章 ， 他 其 至 给 出 了 一 个 super() 的 纯 Python 实 现 ， 这 样 ， 你 
可 以 加 深 其 印象 ， 知 道 它 是 如 何 工作 的 ! 


最 后 想到 ...super() 的 主要 用 途 ， 是 来 查找 父 类 的 属性 ， 比 如 super 
(MyClass,self) . init ()。 如 果 你 没有 执行 这 样 的 查找 ， 你 可 能 不 需要 使 用 super()。 


有 很 多 如 何 使 用 super() 的 例子 分 散在 本 章 中 。 记 得 阅读 一 下 第 13.11.2 节 中 有 关 super() 的 重要 
提示 ， 尤 其 是 核心 笔记 。 
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13.12.6 vars() 


vars() 内 建 函 数 与 dir() 相 似 ， 只 是 给 定 的 对 象 参 数 都 必须 有 一 个 _、dict 属性。vars() 返 回 一 个 
字典 ， 它 包含 了 对 象 存 储 于 其 dict ”中 的 属性 (4) 和 值 。 如 果 提 供 的 对 象 没有 这 样 一 个 属 
性 ， 则 会 引发 一 个 TypeError 异 常 。 如 果 没 有 提供 对 象 作为 vars() 的 一 个 参数 ， 它 将 显示 一 个 
包含 本 地 名 字 空 间 的 属性 ( 键 ) 及 其 值 的 字典 ， 也 就 是 ，locals()。 我 们 来 看 一 下 例子 ， 使 用 
类 实例 调用 vars() : 


class C (object): 
pass 


»»» c - C() 

>>> CO.foo = 100 

>>> c.bar = 'Python' 

so». Xdict . 

('*£oo':s 100, *'bar': "'Python'] 
>>> vars(c) 

("fogs 2180, "'bar': Pyton") 


表 13.3 概 括 了 类 和 类 实例 的 内 建 函 数 。 


XX 13.3 类 ， 实 例 及 其 他 对 象 的 内 建 函数 
LE 4 N m 述 
issubclass suh, sup) In JS sub 是 类 sup 的 子 类 ， 则 返回 Trve， 反 之 为 False 


如 果实 例 objl 是 类 obj2 或 者 obj2 子 类 的 一 个 实例 ,或 者 如 果 objl 是 obj2 HRM, 
则 返回 Tre: I2. A False 


hasattr(obj, attr) 如 此 obj 有 属性 anr HEINA) «0 BE Trve， 反 之 ， 返 回 False 


获取 obj 的 attr 属性 : 与 返回 obj.attr RE; 如 果 anr 不 是 obj 的 属性 ， 如 果 提 供 了 
默认 值 ， 则 返回 默认 值 ， 不 然 ， 就 会 引发 一 个 AttributeError 异常 

设置 obj 的 attr 属性 值 为 val， 替 换 任 何 已 存在 的 属性 值 ; 不 然 ， 就 创建 属性 : 类 
做 于 obj.attr-val. . 

delattr(obj, attr) 从 obj PRRI YE attr【 以 字符 串 给 出 ) ; 类似 于 del obj-attr 





isinstance(obj / , obj2) 


getattr(obj, attr[, defauli]) 


setattr( obj, atir, val) 
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ax 
Na i Y Hi 述 
返回 obj 的 属性 的 一 个 列表 :如果 没有 给 定 ouj，dir0 则 显示 局 部 名 学 空间 中 的 属 
性 ， 也 就 是 locals() keys() 
返回 一 个 表示 父 类 类 型 的 代理 对 象 ， 如 果 设 有 传 入 obj， 则 返回 的 super HÆ 
super(type, obj=None)” iru. 2. m!" obj 是 一 个 type，issabclass(tobjtype) 必 为 True; WW 
isinstance(obj,type) 4 Jj True 


返回 obj 0) REPE RCCLUS —1F A MRAR RN obj, vas) Uo IS QE ng 
R ORTERJIUMTD) ， 也 就 是 locali) 


dir(obj =None) 


vars(obj -None) 


a. Python22 中 新 增 ， 仅 对 新 式 类 有 效 。 


13.13 ”用 特殊 方法 定制 类 


我 们 已 在 本 章 前 面部 分 讲解 了 方法 的 两 个 重要 方面 : M Lon api e dE 
们 相应 类 的 某 个 实例 中 ) ; 其 次 ， 有 两 个 特殊 方法 可 以 分 别 作为 构造 器 和 解构 器 的 功能 ， 
别名 为 init ()fe del ()e 


Ma E EM Ma M a M m MA MES or 
的 默认 行为 ， 而 其 他 一 些 则 没有 ， 留 到 需要 的 时 候 去 实现 。 这 些 特殊 方法 是 Python 中 用 来 扩 
充 类 的 强 有 力 的 方式 。 它 们 可 以 实现 : 

e 模拟 标准 类 型 

e 重 载 操 作 符 

EE ，*， 其 至 包括 分 段 下 标 及 映射 操作 操作 [] 来 模拟 标准 类 


型 。 如 同 其 他 很 多 保留 标识 符 ， 这 些 方法 都 是 以 双 下 划 线 ( _) 开始 及 结尾 的 。 表 13.4 列 出 
了 所 有 特殊 方法 及 其 他 的 描述 。 


3X 13.4 用 来 定制 类 的 特殊 方法 
"ox Jj i g 

M Aue Mt 
C. init (self argl, ...]) 构造 器 ATR) 
C... sew. (nifi, nally Sen 〈 昔 一 些 可 选 的 参数 》 : 通常 用 在 役 置 不 变数 括 类 型 的 
C. del (self) 和 解构 器 
C. str (self) 可 打印 的 字符 输出 ;内 建 sr0) 及 print 语句 
C. repr. (self) 运行 时 的 字符 让 输出 ;内 建 repr() FO * * Hem 


C. unicode (self) 

C. cal (self, *args) 

C. nonzero (self) 

C. len (self) 

Hg CID 比较 

C. cmp (self, obj) 

C. h (xelfob)andC. le (self, obj) 
C. gt (self ob)andC. ge (self, obj) 
C. eq (self. ob))andC. nme (self, obj) 
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Unicode FIF MIAH: 内 建 unicode() 
表示 可 调用 的 实例 

为 object 定义 False M: HRE bool) (从 22 RF H) 
“长 度 ”《 可 用 于 类 ) ; AE len) 


对 象 比较 :内 建 cmpO 

小 于 /小 于 或 等 于 对 应 < 及 <= 换 作 符 
大 于 / 火 于 或 等 于 ， 对 应 > 及 一 操作 符 
等 于 /不 等 于 ， 对 应 一 ,及 一 搞 作 符 
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"mn 


属性 

C. ger (self, atte) 

C. setattr_ (self, attr, val) 
C. delattr. (self, astr) 

C. getatribule (self, atre) 
C. get (self atir) * 

C. set (self, attr, val)* 
C. delete (self antr) * 
定制 类 /模拟 类 型 

数值 类 型: 二 进 制 操作 符 
C. *add (self. obj) 

C. *sub (self, obf) 

C, *mul (self obj) 

C. *'div (self obj) 

C. *tmediv (self, ob)" 
C., *floordiv ( self, obj) * 
C. *mod (self. obj) 

C. *divmod (self, obj) 
C. *pow (self obj |, mod]) 
C. *ishifi (self, obj) 
定制 类 /模拟 类 型 

数值 类 型 ， 二 进 制 的 作 符 







C. "and (self, obj) 





C. *xor (self obj) 


数值 类 型 ;一 元 的 作 符 


"x 
A x 


获取 属性 ; AE geta): 仅 当 属性 没有 找到 时 调用 
设置 后 性 

Bun 

AURTE: A gemt): 总 是 被 调用 

GRE) 获取 属性 

GERD. 设置 属性 

(WGE) INR IE 


加 : emm 

Wc Mik 

5» RN 

c. mnm 

True 除 ，/ 损 作 符 

Floor 除 ，// 失 作 符 
取 模 / 取 余 : % 挫 作 符 
MORUUHL. PLE divmod() 
HOS. 内 建 Pow0: tE 
AWO. cde 






右 移 ;>> 损 作 符 
m5. 入 操作 符 
RRR, | 操作 符 
Bu. Wem 








Hou. 兴建 abs() 





数值 类 型 ， 数 值 转换 
C. complex (self, com) 


转 为 complex Et); Sf complex() 
转 为 im; EE im 


3435 long: AIE long) 
SEH float: AE float) 
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m 


特殊 方法 mo £ 
数值 类 型 ， 基 本 表示 法 Siring) 






八进制 表示 ; HE oct) 
十 六 进 制 表示 ; 内 建 hex() 


数值 类 型 :数值 压缩 







压 端 成 网 样 的 数值 基 型 :内 建 coerce() 


EAGEN., Hemos n c sme. ibm. 用 于 切片 索 
7125 





C. coerce (self, mum) 


C. index (elf) 





序列 类 型 








C. len (self) 序列 中 项 的 数目 
名 到 单个 序列 元 素 
设置 单个 序列 元 素 


遇险 单 个 序列 元 素 








C. getitem (self, ind) 
C. setütem (self, ind,val) 
C. delitem (self, ind) 












序列 类 型 


C. getslice (self, indl ind2) 得 到 序列 片段 

C._ setslice (self, i1, Rival) 设置 序列 片段 

C. delslice (self, indl ind2) : BT SR 

C. contains (self, val)" MuTHAEO. hii in 关键 字 
C. *add (xelf,.obj) Mig, aen 

C. *mul (self.obj) mu. "nne 

C. ier (self)* ORANA: HE ite) 
RHAN 

C. len (self) mapping 中 的 项 的 数 日 

C. hash (self) MiFi Chash) 函数 值 

C. getitem (self key) "EU. (key) iN 
C._setitem_ (self key,val) 没 置 洽 定 键 (key》 的 值 

C. delitem (self key) BEU (key) 的 值 
C._missing_ (sel/ /hey) 给 定 键 如 果 不 存在 字典 中 ， 则 提供 一 个 默认 值 


a. Pythoa22 中 新 引入 ， 仅 用 于 新 式 类 中 。 

b. Python 23 中 新 引入 ， 

c. RET cmp0 外 ， 其 余 全 是 在 Python 新 引入 的 ， 

d. "** 代表 "(selp OP obj). 'r'(obj OP selfjfer( li lt(in-place)H AF, Python 2.0 Bi). (ir add. — radd 3X dadd . 
€ 

f. 

g 





, Python 22 中 新 引入 。 
, "*" 代表 "(selp OP obj), Y(obj OP sci0， 成 名 原 位 (in-place) 拘 作 ，Python 16 MM), Pi add. — radd 或 _ iadld . 


，Python 2.5 中 新 引入 。 


基本 的 定制 和 对 象 〈( 值 ) 比较 特殊 方法 在 大 多 数 类 中 都 可 以 被 实现 ， 且 没有 同 任 何 特定 的 类 
型 模型 绑 定 。 延 后 设置 ， 也 就 是 所 谓 的 富 比较 (Rich Comparison) ， 在 Python2.1 中 加 入 。 
属性 组 帮助 管理 你 的 类 的 实例 属性 。 这 同样 独立 于 模型 。 还 有 一 个 ，_getattribute _()， 它 公 
用 在 新 式 类 中 ， 我 们 将 在 后 面 的 章节 中 对 它 进行 描述 。 


特殊 方法 中 数值 类 型 部 分 可 以 用 来 模拟 很 多 数值 操作 ， 和 包括 那些 标准 (一 元 和 二 进 制 ) 操作 
符 、 类 型 转换 、 基 本 表示 法 及 压缩 。 还 有 用 来 模拟 序列 和 映射 类 型 的 特殊 方法 。 实 现 这 些 类 
型 的 特殊 方法 将 会 重 载 操作 符 ， 以 使 它们 可 以 处 理 你 的 class 类 型 的 实例 。 


另外 ， 除 操作 符 _*truediv_ ()f» "*floordiv ()&Python 2.2 中 加 入 ， 用 来 支持 Python 除 操 作 
符 中 待定 的 更 改 一 一 可 查看 5.5.3 节 。 基 本 上 ， 如 果 解 释 器 启用 新 的 除法 ， 不 管 是 通过 一 个 开 
关 来 启动 Python， 还 是 通过 “from future import division”， 单 斜 线 除 操作 (/) 表示 的 将 





$13 ”面向 对 象 编程 563 


TERA’ ALECK RANNE” TCEZIRAEEOCEU GIO AA AGDEUE (复数 除法 
保持 不 变 ) 。 双 斜 线 除 操作 (//) 将 提供 大 家 熟悉 的 浮 点 除法 ， 从 标准 编译 型 语言 像 C/C++ 及 
Java 过 来 的 工程 师 一 定 对 此 非常 熟悉 。 同 样 ， 这 些 方法 只 能 处 理 实现 了 这 些 方法 并 且 启 用 了 
新 的 除 操 作 的 类 的 那些 符号 。 


表格 中 ， 在 它们 的 名 字 中 ， 用 星 号 通配符 标注 的 数值 二 进 制 操作 符 则 表示 这 些 方 法 有 多 个 版 
本 ， 在 名 字 上 有 些许 不 同 。 星 号 可 代表 在 字符 囊 中 没有 额外 的 字符 ， 或 者 一 个 简单 的 “r" 指 明 
是 一 个 右 结合 操作 。 没 有 “r"， 操 作 则 发 生 在 对 于 selfOP obj 的 格式 ;“P 的 出 现 表明 格式 obj OP 
self。 比如， add (self, obj) 是 针对 selftobj 的 调用 ， 而  radd (self, obj) 则 针对 
obj+self 来 调用 。 


增 量 赋值 ， 起 于 Python 2.0， 介 绍 了 “ 原 位 ?操作 符 。 一 个 中 代替 星 号 的 位 置 ， 表 示 左 结合 操作 
与 赋值 的 结合 ， 相 当 是 在 self=self OP obj。 举 例 ， iadd — (self, obj) 相当 于 self=self+obj 
的 调用 。 


随 着 Python 2.2 中 新 式 类 的 引入 ， 有 一 些 更 多 的 方法 增加 了 重 载 功能 。 然 而 ， 在 本 章 开 始 部 分 
提 到 过 ， 我 们 仅 关 注 经 典 类 和 新 式 类 都 适应 的 核心 部 分 ， 本 章 的 后 续 部 分 ， 我 们 介绍 新 式 类 
的 高 级 特性 。 


13.13.1 简单 定制 (RoundFloat2 ) 


我 们 的 第 一 个 例子 很 普通 。 在 某 种 程度 上 ， 它 基于 我 们 前 面 所 看 到 的 从 Python 类 型 中 派生 出 
的 派生 类 RoundFloat 。 这 个 例子 很 简单 。 事 实 上 ， 我 们 甚至 不 想 去 派生 任何 东西 《当然 ， 除 
object 外 ) ...... 我 们 也 不 想 采 用 与 floats 有 关 的 所 有 “好 东西 "。 不 ， 这 次 ， 我 们 想 创建 一 个 苗条 
的 例子 ， 这 样 你 可 以 对 类 定制 的 工作 方式 有 一 个 更 好 的 理解 。 这 种 类 的 前 提 与 其 他 类 是 一 样 
的 : 我 们 只 要 一 个 类 来 保存 浮 点 型 ， 四 使 五 入 ， 保 留 两 位 小 数位 。 
class RoundFloatManual (object): 
def | init — (self, vál): 
assert isinstance(val, float), \ 
"Value must be a float!" 
self.value = round(val, 2) 


这 个 类 仅 接 收 一 个 浮 点 值 一 一 它 断 言 了 传递 给 构造 器 的 参数 类 型 必须 为 一 个 浮 点 型 一 一 并 且 
将 其 保存 为 实例 属性 值 。 让 我 们 来 试 试 ， 创 建 这 个 类 的 一 个 实例 : 
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>>> rfm = RoundFloatManual (42) 
Traceback (most recent call last): 
File "«stdin»", line 1l, in ? 
File "roundFloat2.py", line 5, in, init. . 
assert isinstance(val, float), \ 
AssertionError: Value must be a float! 
>>> rfm = RoundFloatManual (4.2) 
>>> rfm 
«roundFloat2.RoundFloatManual object at 0x63030» 
>>> print rfm 
«roundFloat2.RoundFloatManual object at 0x63030» 


你 已 看 到 ， 它 因 输 入 非法 ， 而 “ 嘻 住 ， 但 如 果 输 入 正确 时 ， 就 没有 任何 输出 了 。 可 是 ， 当 把 这 
个 对 象 转 存在 交互 式 解释 器 中 时 ， 看 一 下 发 生 了 什么 。 我 们 得 到 一 些 信 息 ， 却 不 是 我 们 要 找 
的 。 (我 们 想 看 到 数值 ， 对 吧 ?) 调用 print 语 名 同样 没有 明显 的 帮助 。 


不 幸 的 是 ，print (使 用 str()) fe 3E GS EAE PX S XAR (使 用 repr()) 都 没 能 显示 更 多 有 关 我 
们 对 象 的 信息 。 一 个 好 的 办 法 是 ， 去 实现 str () 和 repr () 二 者 之 一 ， 或 者 两 者 都 实现 ， 

这 样 我 们 就 能 "看 到 ?我 们 的 对 象 是 个 什么 样子 了 。 换 名 话说 ， 当 你 想 显 示 你 的 对 象 ， 实 际 上 是 
想 看 到 有 意义 的 东西 ， 而 不 仅仅 是 通常 的 Python 对 象 字 符 串 〈<object object at id» ) 。 让 我 
们 来 添加 一 个 _str () 方 法， 以 履 盖 默认 的 行为 : 


def str (self): 


return '2$.2f' $ self.value 


现在 我 们 得 到 下 面 的 : 


>>> rfm = RoundFloatManual (5.590464) 

>>> rfm 

«roundFloat2.RoundFloatManual object at Ox5eff0» 
>>> print rfm 

9.59 

>>> rfm = RoundFloatManual (5.5964) 

>>> print rfm 

5.6 
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我 们 还 有 一 些 问题 ...... 一 个 问题 是 仅仅 在 解释 器 中 转 储 (dump) 对 象 时 ， 仍 然 显 示 的 是 默认 
对 象 符号 ， 但 这 样 做 也 算 不 错 。 如 果 我 们 想 修复 它 ， 只 需要 覆盖 repr ()。 因 为 字符 串 表 示 
法 也 是 Python 对 象 ， 我 们 可 以 让 _repr (ffe str /() 的 输出 一 致 。 


为 了 完成 这 些 ， 只 要 把 _str (ARARAS repr _()。 这 是 一 个 简单 的 例子 ， 所 以 它 没有 
昊 正 对 我 们 造成 负面 影响 ， 但 作为 程序 员 ， 你 知道 那 不 是 最 好 的 办 法 。 如 果 str. (FEA 
bug， 那 么 我 们 会 将 bug 也 复制 给 repr () 了 。 


最 好 的 方案 ， 在 _ str_() 中 的 代码 也 是 一 个 对 象 ， 同 所 有 对 象 一 样 ， 引 用 可 以 指向 它们 ， 所 
以 ， 我 们 可 以 仅仅 让 _repr__() 作 为 str_() 的 一 个 别名 : 


. repr = _STr 


在 带 参数 5.5964 的 第 二 个 例子 中 ， 我 们 看 到 它 舍 入 值 刚好 为 5.6， 但 我 们 还 是 想 显 示 带 两 位 小 
数 的 数 。 来 一 个 更 妙 的 方法 吧 ， 看 下 面 : 


def str (self): 


Q. 


return '%.2f' % self.value 


这 里 就 同时 具备 str() 和 repr() 的 输出 了 : 


>>> rfm = RoundFloatManual (5.5964) 
2»» rfm 

5.60 

>>> print rfm 

9.60 


4113.2. 基本 定制 (roundFloat2.py ) 


1 k'!/usr/bin/env python 
2 


assert isinstance(val, f 
"Value must be a float!" 


self.value = round(val, 2) 


def str (self) 


return '* 
repr > str 


在 本 章 开 始 部 分 ， 最 初 的 RoundFloat 例 子 ， 我 们 没有 担心 所 有 细致 对 象 的 显示 问题 ; 原因 是 
str (和 _ repr_() 作 为 float 类 的 一 部 分 已 经 为 我 们 定义 好 了 。 我 们 所 要 做 的 就 是 去 继承 它 
们 。 增 强 版 本 “手册 "中 需要 另外 的 工作 。 你 发 现 派 生 是 多 么 的 有 益 了 吗 ? 我 们 甚至 不 需要 知道 
解释 器 在 继承 树 上 要 执行 多 少 步 才 能 找到 一 个 已 声明 的 你 正在 使 用 却 没 有 考虑 过 的 方法 。 我 
们 将 在 例 13.2 中 列 出 这 个 类 的 全 部 代码 。 


现在 开始 一 个 稍 复杂 的 例子 。 


13.13.2 ”数值 定制 (Time60) 


作为 第 一 个 实际 的 例子 ， 我 们 可 以 想象 需要 创建 一 个 简单 的 应 用 ， 用 来 操作 时 间 ， 精 确 到 小 
时 和 分 。 我 们 将 要 创建 的 这 个 类 可 用 来 跟踪 职员 工作 时 间 ，ISP 用 户 在 线 时 间 ， 数 据 库 总 的 运 
行 时 间 (不 包括 备份 及 升级 时 的 停机 时 间 ) ， 在 扑克 比赛 中 玩家 总 时 间 ， 等 等 。 


在 Time60 类 中 ， 我 们 将 整 型 的 小 时 和 分 钟 作为 输入 传 给 构造 器 。 


class Time60 (object): # 顺序 对 
def init (self, hr, min): # 构造 器 
self.hr - hr & 给 小 时 赋值 
self.min = min # 给 分 赋值 


1. 显 示 
同样 ， 如 前 面 的 例子 所 示 ， 在 显示 我 们 的 实例 的 时 候 ， 我 们 需要 一 个 有 意义 的 输出 ， 那 么 就 
Rá str () (如 果 有 必要 的 话 ， rep () 也 要 和 覆盖) 。 我 们 都 习惯 看 小 时 和 分 ， 用 冒号 
分 隔 开 的 格式 ， 比 如 ，"“4:30”， 表 示 4 个 小 时 ， 加 半 个 小 时 (4 个 小 时 又 30 分 钟 ) 
def str (self): 
. return '$d:$d' $ (self.hr, self.min) 


用 此 类 ， 可 以 实例 化 一 些 对 象 。 在 下 面 的 例子 中 ， 我 们 启动 一 个 工时 表 来 跟踪 对 应 构造 器 的 
计 费 小 时 数 : 


>>> mon = Time60(10, 30) 
>>> tue = Time60(11, 15) 
b e 


>>> print mon, tue 


10:30 LL£15 


输出 不 错 ， 正 是 我 们 想 看 到 的 。 下 一 步 干 什么 呢 ? 可 考虑 与 我 们 的 对 象 进行 交互 。 比 如 在 时 
间 片 的 应 用 中 ， 有 必要 把 Time60 的 实例 放 到 一 起 让 我 们 的 对 象 执行 所 有 有 意义 的 操作 。 我 们 
更 喜欢 像 这 样 的 : 


>>> Mön + tue 


21:45 


2. 加 法 


Python 的 重 载 操 作 符 很 简单 。 像 加 号 (+) ， 我 们 只 需要 重 载 _add__() 方 法 ， 如 果 合 适 ， 还 
可 以 用 _radd_() 及 _iadd _()。 稍 后 有 更 多 有 关 这 方面 的 描述 。 实 现 _add__() 听 起 来 不 难 
只 要 把 分 和 小 时 加 在 一 块 。 大 多 数 复杂 性 源 于 我 们 怎么 处 理 这 个 新 的 总 数 。 如 果 我 们 想 
看 到 “21:45”， 就 必须 认识 到 这 是 另 一 个 Time60 对 象 ， 我 们 没有 修改 mon 或 tue， 所 以 ， 我 们 的 
方法 就 应 当 创建 另 一 个 对 象 并 填 入 计算 出 来 的 总 数 。 





£3, add () 特 殊 方法 时 ， 首 先 计算 出 个 别 的 总 数 ， 然 后 调用 类 构造 器 返回 一 个 新 的 对 象 : 


def add — (self, other): 
return self. class  . (self.hr + other.hr, 


self.min * other.min) 


和 正常 情况 下 一 样 ， 新 的 对 象 通过 调用 类 来 创建 。 唯 一 的 不 同 点 在 于 ， 在 类 中 ， 你 一 般 不 直 
接 调 用 类 名 ， 而 是 使 用 self 的 ”class “属性 ， 即 实例 化 self 的 那个 类 ， 并 调用 它 。 由 于 
self. class “与 Time60 相 同 ， 所 以 调用 self，_class__“() 与 调用 Time60() 是 一 回 事 。 





不 管 怎样 ， 这 是 一 个 更 面向 对 象 的 方式 。 另 一 个 原因 是 ， 如 果 我 们 在 创建 一 个 新 对 象 时 ， 处 
处 使 用 站 实 的 类 名 ， 然 后 ， 决 定 将 其 改 为 别 的 名 字 ， 这 时 ， 我 们 就 不 得 不 非常 小 心地 执行 全 
局 搜索 并 替换 。 如 果 千 使 用 self.， class ， 就 不 需要 做 任何 事情 ， 只 需要 直接 改 为 你 想 要 的 


类 名 。 


好 了 ， 我 们 现在 来 使 用 加 号 重 载 ，“ 增 加 ” Time60 对 象 : 


Time60(10, 30) 
Time60(11, 15) 
>>> mon + tue 


«time60.Time60 object at 0x62190» 


>>> mon 


>>> tue 


>>> print mon + tue 


21:45 


哎哟 ， 我 们 忘记 添加 一 个 别名 repr 给 str 了 ， 这 很 容易 修复 。 你 可 能 会 问 ，“ 当 我 们 试 着 在 
重 载 情况 下 使 用 一 个 操作 符 ， 却 没有 定义 相对 应 的 特殊 方法 时 还 有 很 多 需要 优化 和 重要 改良 
的 地 方 ， 会 发 生 什么 事 呢 ? "S € — ^ TypeErrorat % : 


>>> mon - tue 
Traceback (most recent call last): 
File "«stdin»", line 1l, in ? 
TypeError: unsupported operand type(s) for -: 'Time60' 


and 'Time60' 
3. 原 位 加 法 
有 了 增 量 赋值 《在 Python 2.0 中 引入 ) ， 我 们 也 许 还 有 和 硕 望 履 盖 “ 原 位 "操作 ， 比 如 ， 
_ jadd (0)。 这 是 用 来 支持 像 mon+= tue 这 样 的 操作 符 ， 并 把 正确 的 结果 赋 给 mon。 重 载 一 个 
六 (方法 的 唯一 秘密 是 它 必 须 返 回 sef。 把 下 面 的 片段 加 到 我 们 例子 中 ， 以 修复 上 面 的 
repr() 问 题 ， 并 支持 增 量 赋值 : 
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TODr = Str . 


def | iadd . (self, other): 


self.hr += other.hr 
self.min += other.min 
return self 

下 面 是 结果 输出 : 


>>> mon =Time60 (10,30) 


>>> tue =Time60 (11,15) 
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225» mon 

10:30 

>>> id(mon) 
401872 

>>> mon += tue 
>>> id(mon) 
401872 

>>> mon 

21:45 


注意 ， 使 用 id() 内 建 函 数 是 用 来 确定 一 下 ， 在 原 位 加 的 前 后 ， 我 们 确实 是 修改 了 原来 的 对 象 ， 
而 没有 创建 一 个 新 的 对 象 。 对 一 个 具有 巨大 潜能 的 类 来 说 ， 这 是 很 好 的 开始 。 在 例 13.3 中 给 
出 了 Time60 的 类 的 完全 定义 。 


例 13.3 中 级 定制 〈time60.py ) 


o o5 
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例 13.4 
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#!/usr/bin/env python 


class Time60 (object): 


'Time60 - track hours and minutes' 


def 3 init . (self, hr, min): 
'Time60 constructor - takes hours and minutes' 
self.hr = hr 


self.min = min 


def str . (self): 
'Time60 - string representation' 
return '$d:$d' $ (self.hr, self.min) 


QEADE. - - . r 

def _add_ (self, other): 
'Time60 - overloading the addition operator' 
return self. class  J (self.hr + other.hr, 
self.min + other.min) 

def — iadd  J (self, other): 
'Time60 - overloading in-place addition' 
self.hr += other.hr 
self.min += other.min 
return self 


随机 序列 迭代 器 (randSeq.py) 


*&!/usr/bin/env python 


from random import choice 


class RandSeq(object): 


def — init  J (self, seq): 
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7 self.data = seq 


8 

9 def iter (self): 

10 return self 

11 

12 def next(self): 

i13 return choice (self.data) 


4. 进一步 优化 


现在 暂时 告 一 段落 ， 但 在 这 个 类 中 ， 还 有 很 多 需要 优化 和 改良 的 地 方 。 比 如 ， 如 果 我 们 不 传 
入 两 个 分 离 的 参数 ， 而 传 入 一 个 2 元 组 给 构造 器 作为 参数 ， 是 不 是 更 好 些 呢 ?3 如果 是 
像 “10:30” 这 样 的 字符 事 的 话 ， 结 果 会 怎样 ? 


答案 是 肯定 的 ， 你 可 以 这 样 做 ， 在 Python 中 很 容易 做 到 ， 但 不 是 像 很 多 其 他 面向 对 象 语言 一 
样 通过 重 载 构造 器 来 实现 。Python 不 允许 用 多 个 签名 重 载 可 调用 对 象 。 所 以 实现 这 个 功能 的 
唯一 的 方式 是 使 用 单一 的 构造 器 ， 并 由 isinstance() 和 (可 能 的 ) type() 内 建 函 数 执行 自省 功 


2t 
fe o 


能 支持 多 种 形式 的 输入 ， 能 够 执行 其 他 操作 像 减 法 等 ， 可 以 让 我 们 的 应 用 更 健壮 、 灵 活 。 当 
然 这 些 是 可 选 的 ， 就 像 如 虎 添 咽 ”"”， 但 我 们 首先 应 该 担心 的 是 两 个 中 等 程度 的 缺点 : 首先 当 比 
十 分 钟 还 少时 ， 这 种 格式 并 不 是 我 们 所 希望 的 。 其 次 不 支持 60 进 制 (sexagesimal [1]) ( 基 
数 60， 以 60 为 分 母 ) 的 操作 : 


>>> wed = Time60(12, 5) 

>>> wed 

Eres 

>>> thu = Time60(10, 30) 
>>> fri = Time60(8, 45) 

>>> thu + fri 


18:172 


显示 wed 结 果 是 “12:05”， 把 thu 和 fri 加 起 来 结果 会 是 "19:15”。 修 改 这 些 缺 陷 ， 实 现 上 面 的 改进 
建议 可 以 实际 性 地 提高 你 编写 定制 类 技能 。 这 方面 的 更 新 ， 更 详细 的 描述 在 本 章 的 练习 13-20 
中 o 

我 们 希望 你 现在 对 于 操作 符 重 载 、 为 什 


么 要 使 用 操作 符 重 载 及 如 何 使 用 特殊 方法 来 实现 它 已 
有 了 一 个 更 好 的 理解 了 。 接 下 来 为 选 看 章节 


内 容 ， 让 我 们 来 了 解 更 多 复杂 的 类 定制 的 情况 。 


13.13.3 ”迭代 器 (RandSeq 和 Anylter) 


1. RandSeq 


我 们 正式 介绍 迭代 器 是 在 第 8 章 ， 但 在 全 书 中 都 在 用 它 。 它 可 以 一 次 一 个 的 遍历 序列 (或 者 是 
类 似 序 列 对 象 ) 中 的 项 。 在 第 8 章 中 ， 我 们 描述 了 如 何 利用 一 个 类 中 的 _ iter _() 和 next() 方 
法 ， 来 创建 一 个 迭代 器 。 我 们 在 此 展示 两 个 例子 。 


第 一 个 例子 是 RandSeq (RANDom SEQuence 的 缩写 ) 。 我 们 给 我 们 的 类 传 入 一 个 初始 序 
列 ， 然 后 让 用 户 通 过 next() 去 迭代 (无穷) 。 


init _() 方 法 执行 前 述 的 赋值 操作 。 der () 仅 返回 self， 这 就 是 如 何 将 一 个 对 象 声 明 为 迭 
代 器 的 方式 ， 最 后 ， 调 用 next() 来 得 到 迭代 器 中 连续 的 值 。 这 个 迭代 器 唯一 的 亮点 是 它 没有 终 
T 
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为 我 们 无 损 地 读 取 一 个 序列 ， 所 以 它 是 不 会 越界 的 。 每 次 用 户 调 用 next() 时 ， 它 会 得 到 下 一 个 
和 迭代 值 ， 但 我 们 的 对 象 永远 不 会 引发 Stoplteration 异 常 。 我 们 来 运行 它 ， 将 会 看 到 下 面 的 输 
at 
>>> from randseq import RandSeq 
>>> for eachlItem in RandSeq( 
['YOGK'^,; 'paper', 'sclssors")) 


print eachItem 


Scissors 
Scissors 
rock 
paper 
paper 


Scissors 


例 13.5 ”任意 项 的 迭代 器 (anylter.py) 


1 &!/usr/bin/env python 
2 
3 class AnyIter(object): 
4 def init (self, data, safe=False): 
5 self.safe - safe 
6 self.iter = iter(data) 
7 
8 def iter (self): 
9 return self 
10 
11 def next (self, howmany-1): 
12 retval = [] 
13 for eachItem in range (howmany): 
14 try: 
15 retval.append(self.iter.next()) 
16 except StoplIteration: 
17 if self.safe: 
18 break 
19 else: 
20 raise 
21 return retval 
2. Anylter 


在 第 二 个 例子 中 ， 我 们 的 确 创建 了 一 个 迭代 器 对 象 ， 我 们 传 给 next() 方 法 一 个 参数 ， 控 制 返 回 
条 目的 数目 ， 而 不 是 去 一 次 一 个 地 迭代 每 个 项 。 下 面 是 我 们 的 代码 (ANY number of items 
ITERator) (笔者 这 里 的 注释 是 告诉 读者 类 “Anylter" 是 如 何 命名 的 ， 译 者 注 ) 


和 RandSeq 类 的 代码 一 样 ， 类 Anylter 很 容易 领会 。 我 们 在 上 面 描述 了 基本 的 操作 ... 它 同 其 他 
和 迭代 器 一 样 工作 ， 只 是 用 户 可 以 请 求 一 次 返回 N 个 迭代 的 项 ， 而 不 仅 是 一 个 项 。 


我 们 给 出 一 个 迭代 器 和 一 个 安全 标识 符 (safe) 来 创建 这 个 对 象 。 如 果 这 个 标识 符 (safe) 为 
Š (True) ， 我 们 将 在 遍历 完 这 个 迭代 器 前 ， 返 回 所 获取 的 任意 条 目 ， 但 如 果 这 个 标识 符 为 
1& (False) ， 则 在 用 户 请 求 过 多 条 目 时 ， 将 会 引发 一 个 异常 。 错 综 复 杂 的 核心 在 于 next()， 
特别 是 它 如 何 退 出 的 (14~21 行 ) ° 


ps 


在 next() 的 最 后 一 部 分 中 ， 我 们 创建 用 于 返回 的 一 个 列表 项 ， 并 且 调 用 对 象 的 next() 方 法 来 获 
得 每 一 项 条 目 。 如 果 我 们 遍历 完 列表 ， 得 到 一 个 Stoplteration 异 常 ， 这 时 则 检查 安全 标识 符 
(safe) 。 如 果 不 安 全 (FP > self.safe=False) ， 则 将 异常 抛 还 给 调用 者 (raise) ; 否则 ， 退 
出 (break) 并 返回 (return). 已 经 保存 过 的 所 有 项 
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>>> a AnyIter (range (10) ) 
>>> i = iter(a) 


>>> for j in range(1,5): 


>>> print j, ':', i.nsext(7) 
1.3 I9] 

2 X Di 2] 

3 rf O; 4; 5] 

AS [B5, 7, 8, 9] 


上 面 程序 的 运行 没有 问题 ， 因 为 迭代 器 正好 符合 项 的 个 数 。 当 情况 出 现 偏 差 ， 会 发 生 什 么 
呢 ? 让 我 们 首先 试 试 “ 不 安全 (unsafe) "的 模式 ， 这 也 就 是 紧 随 其 后 创建 我 们 的 迭代 器 : 
>>> i = iter(a) 
>>> i.next(14) 
Traceback (most recent call last): 
Pile stain"; line Ll, in 7? 
File "anyIter.py", line 15, in next 
retval.append(self.iter.next()) 
StopIteration 
因为 超出 了 项 的 支持 量 ， 所 以 出 现 了 Stoplteration 异 常 ， 并 且 这 个 异常 还 被 重新 引发 回调 用 者 


《第 20 行 ) 。 如 果 我 们 使 用 "安全 (safe) "模式 重建 迭代 器 ， 再 次 运行 一 次 同一 个 例子 的 话 ， 
我 们 就 可 以 在 项 失控 出 现 前 得 到 迭代 器 所 得 到 的 元 素 : 


>>> AnyIter(range(10), True) 


w 
Il 


V 
V 
V 
r^ 

I 


iter (a) 
>>> i.next(14) 
LO; l, 2, 3, 4, 5, 6, 7, 8, 9] 


第 13 章 ”面向 对 象 编程 576 


13.43.4 * 多 类 型 定制 (NumStr) 


现在 创建 另 一 个 新 类 ，NumStr， 由 一 个 数字 -字符 对 组 成 ， 相 应 地 ， 记 为 n 和 s， 数 值 类 型 使 用 
整 型 (integer) 。 尽 管 这 组 顺序 对 的 “合适 的 "记号 是 (n，S) ， 但 我 们 选用 [n::s] 来 表示 它 ， 
有 点 不 同 。 暂 不 管 记 号 ， 这 两 个 数据 元 素 只 要 我 们 模型 考虑 好 了 ， 就 是 一 个 整体 。 可 以 创建 
我 们 的 新 类 了 ， 叫 做 NumStr， 有 下 面 的 特征 : 


1. 初 始 化 


类 应 当 对 数字 和 字符 串 进行 初始 化 ; 如 果 其 中 一 个 〈 或 两 ) 没有 初始 化 ， 则 使 用 0 和 空 字符 
囊 ， 也 就 是 ，n=0 且 s=”， 作 为 默认 。 


2. 加 法 


我 们 定义 加 法 操作 符 ， 功 能 是 把 数字 加 起 来 ， 把 字符 连 在 一 起 ; 要 点 部 分 是 字符 串 要 按 顺序 
相连 。 比 如 ，NumsStr1=[nl::sI] 且 NumStr2=[n2::s2]。 则 NumStr1+NumStr2 表 示 
[n1+n2::s1+S2]， 其 中 ，+ 代 表 数 字 相 加 及 字符 相 和 连接。 


3. 乘 法 

类 似 的 ， 定 义 乘 法 操作 符 的 功能 为 数字 相 乘 、 字 符 累积 相连 ， 也 就 是 NumStrl *NumStr2= 
[nl*n::sl*n] ° 

4. False 值 

当 数 字 的 数值 为 0 且 字 符 串 为 空 时 ， 也 就 是 当 NumStr=[0::“] 时 ， 这 个 实体 即 有 一 个 false 值 。 
5. 比 较 


比较 一 对 NumStr 对 象 ， 比 如 ，[n1::s1] vs.[n2::s2]， 我 们 可 以 发 现 九 种 不 同 的 组 合 〈 即 nl>n2 
和 s1<s2、n1==n2 和 s1>s2 等 )。 对 数字 和 字符 串 ， 我 们 一 般 按照 标准 的 数值 和 字典 顺序 的 进 
行 比较 ， 即 ， 如 果 obj1<obj2， 普 通 比 较 cmp (obj1，obj2) 的 返回 值 是 一 个 小 于 0 的 整 型 ， 当 
obj1>obj2 时 ， 比 较 的 返回 值 大 于 0， 当 两 个 对 象 有 相同 的 值 时 ， 比 较 的 返回 值 等 于 0。 


我 们 的 类 的 解决 方案 是 把 这 些 值 相 加 ， 然 后 返回 结果 。 有 趣 的 是 cmp() 不 会 总 是 返回 -1、0 或 
1。 上 面 提 到 过 ， 它 是 一 个 小 于 、 等 于 或 大 于 0 的 整数 。 

为 了 能 够 正确 的 比较 对 象 ， 我 们 需要 让 ”cmp _() 在 (n1>n2) E (s1»s2) 时 返回 -1， 在 
(nl<n2) 且 (s1«s2) 时 返回 -1， 而 当 数值 和 字符 串 都 一 样 时 ， 或 是 两 个 比较 的 结果 正 相 反 
nt (Pp (nf«n2) E (s1»s2) ， 或 相反 ) 返回 0， 反 之 亦 然 。 


例 13.6 ”多 类 型 类 定制 (numstr.py) 
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1 k£!/usr/bin/env python 

2 

3 class NumStr (object): 

B 

5 def init  J (self, num=0, string-s''): 

6 self. | num = num 

7 self. string = string 

8 

9 def str  J (self): # define for str() 
10 return '[$d :: $r]' $ y 

11 self. num, self. string) 

12 WE - 3 str 

13 

14 def 3. add — (self, other): # define for s+t+o 
15 if isinstance(other, NumStr): 

16 return self. class  J(self. num + \ 
17 other. num, \ 

18 self. string + other. | string) 
19 else: 

20 raise TypeError, \ 

21 'Illegal argument type for built-in operation' 
22 

23 def mul  J (self, num): # define for o*n 
24 if isinstance(num, int): 

25 return self. class (self. num * num 
26 self. string * num) 

27 else: 
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28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 


raise TypeError, \ 
'Illegal argument type for built-in operation' 


# False if both are 


return self. num or len(self. _ string) 


def — nonzero . (self): 


def norm cval(self, cmpres): # normalize cmp() 


return cmp(cmpres, 0) 


def » cmp . (self, other): # define for cmp() 
return self. norm cval( 
cmp(self. | num, other. . num)) + \ 
self. norm cval( 
cmp(self. | string, other. — string)) 


根据 上 面 的 特征 ， 我 们 列 出 numstr.py 的 代码 ， 执 行 一 些 例子 : 
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= NumStr(3, 'foo") 
= NumStr(3, 'goo') 
= NumStr(2, 'foo') 
NumStr () 


V 
v 
v 
5» mono Uo 
ll 


>>> e = NumStr(string-'boo') 
>>> = NumStr(1) 
>>> 

[3 £: "fog!] 

>>> b 

[3 Bs .*goo*] 

>>> c 

[2 $3: 'foo"'] 

»»» d 

[0 x3 -eR 

>>> e 

[0 'boo'] 

>>> f 

DA wr S] 
»»»a«b 

True 

>>> b < C 

False 


>>> a == a 


»»»b*2 

[6 :: 'googoo'] 
»»» a*3 

[9 :: 'foofoofoo'] 
>>> bte 

[3 :: 'gooboo'] 
>>> +b 


[3 :: 'boogoo'] 
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>>> if d: 'not false’ # also bool (d) 


>>> 1f e: 'not false" # also bool(e) 


'not false' 
>>> cmp (a,b) 
-1 
>>> cmp (a,c) 
1 
>>> cmp (a,a) 
0 


6. 逐 行 解释 
1~ 7 行 


脚本 的 开始 部 分 为 构造 器 _ init ()， 通 过 调用 NumStr() 时 传 入 的 值 来 设置 实例 ， 完 成 自身 初 
始 化 。 如 果 有 参数 缺失 ， 属 性 则 使 用 false 值 ， 即 默认 的 0 或 空 字符 ， 这 取决 于 参数 情况 。 


一 个 值得 注意 的 偏好 是 命名 属性 时 ， 使 用 双 下 划 线 。 我 们 在 下 一 节 中 会 看 到 ， 这 是 在 信息 隐 
藏 时 强加 一 个 级 别 一 一 尽管 不 够 成 熟 。 程 序 员 导 入 一 个 模块 时 ， 就 不 能 直接 访问 到 这 些 数据 
元 素 。 我 们 正 试 着 执行 一 种 OO 设计 中 的 封装 特性 ， 只 有 通过 存 取 函数 才能 访问 。 如 果 这 种 语 
法 让 你 感 党 有 点 怪异 ， 不 舒服 的 话 ， 你 可 以 从 实例 属性 中 删除 所 有 双 下 划 线 ， 程 序 同 样 可 以 
良好 地 运行 。 


所 有 的 由 双 下 划 线 (__) 开始 的 属性 都 被 “混淆 ” (mangled) 了 ， 导 致 这 些 名 字 在 程序 运行 时 
很 难 被 访问 到 。 但 是 它们 并 没有 用 一 种 难于 被 北向 工程 的 方法 来" 混淆 "。 事 实 上 ，" 混 淆 "属性 
的 方式 已 众所周知 ， 很 容易 被 发 现 。 这 里 主要 是 为 了 防止 这 些 属性 在 被 外 部 模块 导入 时 ， 由 
于 被 意外 使 用 而 造成 的 名 字 冲 突 。 我 们 将 名 字 改 成 含有 类 名 的 新 标识 符 ， 这 样 做 ， 可 以 确保 
这 些 属性 不 会 被 无 意 "访问 "。 更 多 信息 ， 请 参见 13.14 节 中 关于 私有 成 员 的 内 容 。 


9 ~ 12 行 


我 们 把 顺序 对 的 字符 囊 表 示 形 式 确定 为 [Inum::'str"， 这 样 不 论 我 们 的 实例 用 str() 还 是 包含 在 
print 语 句 中 时 候 ， 我 们 都 可 以 用 stt _() 来 提供 这 种 表示 方式 。 我 们 想 强调 一 点 ， 第 二 个 元 
素 是 一 个 字符 串 ， 如 果 用 户 看 到 由 引号 标记 的 字符 串 时 ， 会 更 加 直观 。 要 做 到 这 点 ， 我 们 使 
用 “reprO" 表 示 法 对 代码 进行 转换 ， 把 *%s" 替 换 成 “%P' 。 这 相当 于 调用 repr() 或 者 使 用 单反 引号 
来 给 出 字符 串 的 可 求 值 版 本 可 求 值 版 本 的 确 要 有 引号 : 


>>> print a 
[3 so "TGo60"1 
如 果 在 self. string 中 没有 调用 repr() (去 掉 单 反 引 号 或 使 用 “%s”) 将 导致 字符 串 引 号 丢失 : 


return '[$d :: $s]' $ (self. num, self. string) 


现在 对 实例 再 次 调用 print， 结 果 : 


>>> print a 
[3 $t: T0] 


没有 引号 ， 看 起 来 会 如 何 呢 ? 不 能 信服 qfoo" 是 一 个 字符 串 ， 对 吧 ? 它 看 起 来 更 像 一 个 变量 。 
连作 者 可 能 也 不 能 确定 我们 快 点 悄悄 回 到 这 一 变化 之 前 ， 假 装 从 来 没 看 到 这 个 内 容 ) 。 


代码 中 str () 吉 数 后 的 第 一 行 是 把 这 个 部 数 赋 给 另 一 个 特殊 方法 名 ， ”repr c 我 们 决定 
我 们 的 实例 的 一 个 可 求 值 的 字符 串 表示 应 当 与 可 打印 字符 囊 表示 是 一 样 的 ， 而 不 是 去 定义 一 
个 完整 的 新 函数 ， 成 为 ”str () 的 副本 ， 我 们 仅 去 创建 一 个 别名 ， 复 制 其 引用 。 当 你 实现 

— str. () 后 ， 一 旦 使 用 那个 对 象 作为 参数 来 应 用 内 建 str() 却 数 ， 解 释 器 就 会 调用 这 段 代码 ， 对 


_repr”() 及 repr() 也 一 样 。 


如 果 不 去 实现 ”repr ()， 我 们 的 结果 会 有 什么 不 同 呢 ? 如 果 赋 值 被 取消 ， 只 有 调用 str() 的 
print 语 句 才 会 显示 对 象 的 内 容 。 而 可 求 值 字符 串 表 示 恢 复 成 默认 的 Python 标 准 形式 <..… 
some object information...» 


>>> print a f calls str(a) 
LS t$: 'I056*t] 
>>> a # calls repr(a) 


«NumStr.NumStr instance at 122640» 


14 ~ 215 

我 们 想 加 到 我 们 的 类 中 的 一 个 特征 就 是 加 法 操作 ， 前 面 已 提 到 过 。Python 用 于 定制 类 的 特征 
之 一 是 ， 我 们 可 以 重 载 操作 符 ， 以 使 定制 的 这 些 类 型 更 “实用 ”。 调 用 一 个 函数 ， 

像 "add (obj1,obj2) "是 为 “add”" 对 象 obj1 和 ojb2， 这 看 起 来 好 像 加 法 ， 但 如 果 能 使 用 加 号 


(+) 来 调用 相同 的 操作 是 不 是 更 有 说 服 力 呢 ? 像 这 样 ，obj1+obj2。 


重 载 加 号 ， 需 要 去 为 self (SELF) 和 其 他 操作 数 实现 (OTHER) add ()。_ add  () 函 数 
考虑 Self+Other 的 情况 ， 但 我 们 不 需要 定义 ”radd_() 来 处 理 Other+Self， 因 为 这 可 以 由 
Other 的 _、 add __() 去 考虑 。 数 值 加 法 不 像 字符 串 那 样 结果 受到 (操作 数 ) 顺序 的 影响 。 


加 法 操作 把 两 个 部 分 中 的 每 一 部 分 加 起 来 ， 并 用 这 个 结果 对 形成 一 个 新 的 对 象 _ 通过 将 结 
果 作 为 参数 调用 self， class  () 来 实例 化 (同样 ， 在 前 面 已 解释 过 ) 。 碰 到 任何 类 型 不 正确 
的 对 象 时 ， 我 们 会 引发 一 个 TypeError 异 常 。 


23 ~ 29 行 


我 们 也 可 以 重 载 星 号 [ 靠 实现 _mul _()]， 执 行 数 值 乘法 和 字符 串 重 复 ， 并 同样 通过 实例 化 来 
创建 一 个 新 的 对 象 。 因 为 重复 只 允许 整 型 在 操作 数 的 右边 ， 因 此 也 必 执 行 此 规则 。 基 于 同样 
的 原因 ， 我 们 在 此 也 没有 实现 “rmul ()。 


31 ~ 32 行 


Python 对 象 任何 时 候 都 有 一 个 布朗 值 。 对 标准 类 型 而 言 ， 对 象 有 一 个 false 值 的 情况 为 : 它 是 
一 个 类 似 于 0 的 数值 ， 或 是 一 个 空 序 列 ， 或 者 映射 。 就 我 们 的 类 而 言 ， 我 们 选择 的 数值 必须 为 
0， 字 符 串 要 为 空 作为 一 个 实例 有 一 个 false 值 的 条 件 。 履 盖 ” nonzero__() 方 法 ， 就 是 为 此 目 
的 。 其 他 对 象 ， 像 严格 模拟 序列 或 映射 类 型 的 对 象 ， 使 用 一 个 长 度 为 0 作为 false 值 。 这 些 情 
况 ， 你 需要 实现 “len () 方 法 ， 以 实现 那个 功能 。 


34 ~ 41 行 


. norm cval() (“normalize cmp() value 的 缩写 ") 不 是 一 个 特殊 方法 。 它 是 一 个 帮助 我 们 重 
A cmp (QV E AR: 唯一 的 目的 就 是 把 cmp() 返 回 的 正 值 转 为 1， 负 值 转 为 -1。cmp() 基 
于 比较 的 结果 ， 通 常 返 回 任意 的 正 数 或 负数 (或 0) ， 但 为 了 我 们 的 目的 ， 需 要 严格 规定 返回 
值 为 -1、0 和 1。 对 整 型 调用 cmp() 及 与 0 比较 ， 结 果 即 是 我 们 所 需要 的 ， 相 当 于 如 下 代码 片 


R: 


def | norm cval(self, cmpres): 
if oOmpres < U: 
return -1 
elif cmpres > O0: 
return 1 
else: 
return 0 


两 个 相似 对 象 的 实际 比较 是 比较 数字 ， 比 较 字 符 串 ， 然 后 返回 这 两 个 比较 结果 的 和 。 


13.44 私有 化 


默认 情况 下 ， 属 性 在 Python 中 都 是 “公开 的 ”， 类 所 在 模块 和 导入 了 类 所 在 模块 的 其 他 模块 的 代 
码 都 可 以 访问 到 。 很 多 00 语 言 给 数据 加 上 一 些 可 见 性 ， 只 提供 访问 函数 来 访问 其 值 。 这 就 是 
熟知 的 实现 隐藏 ， 是 对 象 封装 中 的 一 个 关键 部 分 。 


大 多 数 面 向 对 象 语言 提供 “访问 控制 符 ” 来 限定 成 员 郊 数 的 访问 。 
1. 双 下 划 线 (_ ) 


Python 为 类 元 素 〈 属 性 和 方法 ) 的 私有 性 提供 初步 的 形式 。 由 双 下 划 线 开始 的 属性 在 运行 时 
被 “混淆 ”， 所 以 直接 访问 是 不 允许 的 。 实 际 上 ， 会 在 名 字 前 面 加 上 下 划 线 和 类 名 。 上 比如， 以 例 
13.6 (numstrpy) 中 的 self，_num 属 性 为 例 ， 被 “混淆 "后 ， 用 于 访问 这 个 数据 值 的 标识 就 变 成 
了 self。 NumStr num 。 把 类 名 加 上 后 形成 的 新 的 “混淆 "结果 将 可 以 防止 在 祖先 类 或 子孙 类 
中 的 同名 冲突 。 


尽管 这 样 做 提供 了 茶 种 层次 上 的 私有 化 ， 但 算法 处 于 公共 域 中 并 且 很 容易 被 “击败 ”"。 这 更 多 的 
是 一 种 对 导入 源 代码 无 法 获得 的 模块 或 对 同一 模块 中 的 其 他 代码 的 保护 机 制 。 


这 种 名 字 混 淆 的 另 一 个 目的 ， 是 为 了 保护 XXX 交 量 不 与 父 类 名 字 空 间 相 冲突 。 如 果 在 类 中 有 
一 个 XXX 属性 ， 它 将 不 会 被 其 子 类 中 的 XXX 属性 覆盖 。 (回忆 一 下 ， 如 果 父 类 仅 有 一 个 XXX 
属性 ， 子 类 也 定义 了 这 个 ， 这 时 ， 子 类 的 XXX 就 是 覆盖 了 父 类 的 XXX， 这 就 是 为 什么 你 必须 
使 用 PARENT.XXX 来 调用 父 类 的 同名 方法 。) 使 用 XXX， 子 类 的 代码 就 可 以 安全 地 使 用 XX， 
而 不 必 担心 它 会 影响 到 父 类 中 的 XXX 。 


2. 单 下 划 线 (_) 


与 我 们 在 第 12 章 发 现 的 那样 ， 简 单 的 模块 级 私有 化 只 需要 在 属性 名 前 使 用 一 个 单 下 划 线 字 
符 。 这 就 防止 模块 的 属性 用 “from mymodule import*” 来 加 载 。 这 是 严格 基于 作用 域 的 ， 所 以 
这 同样 适合 于 函数 。 


在 Python2.2 中 引进 的 新 式 类 ， 增 加 了 一 套 全 新 的 特征 ， 让 程序 员 在 类 及 实例 属性 提供 保护 的 
多 少 上 拥有 大 量 重 要 的 控制 权 。 尽 管 Python 没 有 在 语法 上 把 private, protected ` friend X 
protected friend 等 特征 内 建 于 语言 中 ， 但 是 可 以 按 你 的 需要 严格 地 定制 访问 权 。 我 们 不 可 能 
涵盖 所 有 的 内 容 ， 但 会 在 本 章 后 面 给 你 一 些 有 关 新 式 类 属性 访问 的 建议 。 


13.15 “授权 


13.15.1 包装 


包装 "在 Python 编程 世界 中 经 常会 被 提 到 的 一 个 术语 。 它 是 一 个 通用 的 名 字 ， 意 思 是 对 一 个 已 
存在 的 对 象 进行 包装 ， 不 管 它 是 数据 类 型 还 是 一 段 代码 ， 可 以 是 对 一 个 已 存在 的 对 象 增 加 新 
的 、 删 除 不 要 的 或 修改 其 他 已 存在 的 功能 。 


在 Python 2.2 版 本 前 ， 从 Python 标准 类 型 子 类 化 或 派生 类 都 是 不 允许 的 。 即 使 你 现在 可 以 对 新 
式 类 这 样 做 ， 这 一 观念 仍然 很 流行 。 你 可 以 包装 任何 类 型 作为 一 个 类 的 核心 成 员 ， 以 使 新 对 
象 的 行为 模仿 你 想 要 的 数据 类 型 中 已 存在 的 行为 ， 并 且 去 掉 你 不 希望 存在 的 行为 ; 它 可 能 会 
要 做 一 些 额 外 的 事情 。 这 就 是 “包装 类 型 "。 在 附录 中 ， 我 们 还 将 讨论 如 何 扩 充 Python， 包 装 的 
另 一 种 形式 。 


包装 包括 定义 一 个 类 ， 它 的 实例 拥有 标准 类 型 的 核心 行为 。 换 名 话说 ， 它 现在 不 仅 能 唱 能 
跳 ， 还 能 够 像 原 类 型 一 样 步行 ， 说 话 。 图 13-4 举 例 说 明了 在 类 中 包装 的 类 型 看 起 像 个 什么 样 
子 。 在 图 的 中 心 为 标准 类 型 的 核心 行为 ， 但 它 也 通过 新 的 或 最 新 的 功能 ， 甚 至 可 能 通过 访问 
实际 数据 的 不 同方 法 得 到 提高 。 


类 对 象 (其 表现 像 类 型 ) 


你 还 可 以 包装 类 ， 但 这 不 会 有 太 多 的 用 途 ， 因 为 已 经 有 用 于 操作 对 象 的 机 制 ， 并 且 在 上 面 已 
VINA de 型 有 对 其 进行 包装 的 方式 。 你 如 何 操作 一 个 已 存 的 类 ， 模 拟 你 需要 的 行 
为 ， 删 除 你 不 喜欢 的 ， 并 且 可 能 让 类 表现 出 与 原 类 不 同 的 行为 呢 ? 我 们 前 面 已 讨论 过 ， 就 是 
TNn 


制定 包装 器 


标准 类 型 








图 13-4 ”包装 类 型 


13.15.2 实现 授权 


授权 是 包装 的 一 个 特性 ， 可 用 于 简化 处 理 相关 命令 性 功能 ， 采 用 已 存在 的 功能 以 达到 最 大 限 
度 的 代码 重用 。 


包装 一 个 类 型 通常 是 对 已 存在 的 类 型 的 一 些 定制 。 我 们 在 前 面 提 到 过 ， 这 种 做 法 可 以 新 建 、 
修改 或 删除 原 有 产品 的 功能 。 其 他 的 则 保持 原样 ， 或 者 保留 已 存 功能 和 行为 。 授 权 的 过 程 ， 
即 是 所 有 更 新 的 功能 都 是 由 新 类 的 菜 部 分 来 处 理 ， 但 已 存在 的 功能 就 授权 给 对 象 的 默认 属 
小 o 


实现 授权 的 关键 点 就 是 覆盖 getattr ()Z7 7A » ARA F 6 — 4 x1 getattr() A E £f že 65 3 

用 。 特 别 地 ， 调 用 getattrO 以 得 到 默认 对 象 属性 (数据 属性 或 者 方法 ) 并 返回 它 以 便 访问 或 调 
用 。 特 殊 方法 getattr _() 的 工作 方式 是 ， 当 搜索 一 个 属性 时 ， 任 何 局 部 对 象 首先 被 找到 ( 定 
制 的 对 象 ) 。 如 果 搜 索 失 败 了 ， 则 ”getattr () 会 被 调用 ， 然 后 调用 getattrO 得 到 一 个 对 象 的 
默认 行为 。 

换言之 ， 当 引用 一 个 属性 时 ，Python 解 释 器 将 试 着 在 局 部 名 称 空间 中 查找 那个 名 字 ， 比 如 一 
个 自 定 义 的 方法 或 局 部 实例 属性 。 如 果 没 有 在 局 部 字典 中 找到 ， 则 搜索 类 名 称 空间 ， 以 防 一 
个 类 属性 被 访问 。 最 后 ， 如 果 两 类 搜索 都 失败 了 ， 搜 索 则 对 原 对 象 开始 授权 请 求 ， 此 时 ， 

. getattr () 23& 08] o 

1. 包 装 对 象 的 简 例 

看 一 个 例子 。 这 个 类 已 乎 可 以 包装 任何 对 象 ， 提 供 基本 功能 ， 比 如 使 用 repr() 和 str() 来 处 理 字 
符 串 表示 法 。 另 外 定制 由 get() 方 法 处 理 ， 它 删除 包装 并 且 返 回 原始 对 象 。 所 以 保留 的 功能 
授权 给 对 象 的 本 地 属性 ， 在 必要 时 ， 可 由 getattr _() 获 得 。 


下 面 是 包装 类 的 例子 : 


lm bp £r A 二 了 一 
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class WrapMe (object): 
def — init X (self, obj): 
self. | data = obj 
def get (self): 
return self. data 
def repr X (self): 
return 'self.  data' 
def str | (malt): 
return str(self. data) 
def 3 getattr (self, attr): 
return getattr(self. data, attr) 
在 第 一 个 例子 中 ， 我 们 将 用 到 复数 ， 因 为 所 有 Python 数值 类 型 ， 只 有 复数 拥有 属性 : 数据 必 


conjugate) A EFA (RANAR RAZ) 。 记 住 ， 属 性 可 以 是 数据 属性 ， 还 可 以 是 
B EX SEX: 


>>> wrappedComplex = WrapMe(3.54*4.2j) 


>>> wrappedComplex # 包装 的 对 象 ; repr () 
(3.5*4.23) 

»»» wrappedComplex.real E KRAH 

e 

>>> wrappedComplex.imag # BEREH 

42.2 

»»» wrappedComplex.conjugate() # ^ conjugate () J 
(3.5-4.23) 

>>> wrappedComplex.get () # ”实际 对 象 


(3.5*4.23) 


一 旦 我 们 创建 了 包装 的 对 象 类 型 ， 只 要 由 交互 解释 器 调用 repr()， 就 可 以 得 到 一 个 字符 串 表 
示 。 然 后 我 们 继续 访问 了 复数 的 三 种 属性 ， 我 们 的 类 中 一 种 都 没有 定义 。 在 例子 中 ， 了 寻找 实 
部 ， 虚 部 及 共 力 复数 的 定义 .……. 查 无 踪影 ! 


对 这 些 属 性 的 访问 ， 是 通过 getattr() 方 法 ， 授 权 给 对 象 。 最 终 调用 get() 方 法 没有 授权 ， 因 为 它 
是 为 我 们 的 对 象 定义 的 一 一 它 返 回 包 装 的 丨 实 的 数据 对 象 。 


下 一 个 使 用 我 们 的 包装 类 的 例子 用 到 一 个 列表 。 我 们 将 会 创建 对 象 ， 然 后 执行 多 种 操作 ， 每 
次 授权 给 列表 方法 。 


—- 

7 
c1 
Co 
N 


>>> wrappedList 


>>> wrappedList 
>>> wrappedList 
>>> wrappedList 
[123, "'foo*, 
2 

>>> wrappedList 
2 

>>> wrappedList 
123 

>>> wrappedList 


[123, "foo", 


注意 ， 尽 管 我 们 正在 我 们 的 例子 中 使 用 实例 ， 它 们 展示 的 行为 与 它们 包装 


45. 
>>> wrappedList. 


45. 


= WrapMe([123, 


.append('bar') 
.append (123) 


61, "Dar"; 123] 
index(45.67) 


.Count (123) 


pop () 


67, 'báür'] 


*"fbn0'. 45.671] 


的 数据 类 型 非常 相 


似 。 然 后 ， 需 要 明白 ， 只 有 已 存在 的 属性 是 在 此 代码 中 授权 的 。 


特殊 行为 没有 在 类 型 的 方法 列表 中 ， 不 外 


EE 被 访问 ， 因 为 它们 不 是 属性 。 一 个 例子 是 ， 对 列表 


的 切片 操作 ， 它 是 内 建 于 类 型 中 的 ， Pep td O 隆 存 在 的 。 从 另 一 个 


角度 来 说 ， 切 片 操作 符 是 序 


| 类 型 的 一 部 分 


， 并 不 是 通 


>>> wrappedList[3] 


Traceback (innermost last): 


File 


File "wrapme 


"«stdin»", 


return getattr(self.data, 


AttributeError: 


AttributeError 有 异常 出 现 的 原因 是 切片 操作 调用 了 _getitem_ 
为 一 个 类 实例 方法 进行 定义 ， 也 不 是 列表 对 象 的 方法 。 回 忆 一 下 ， 什 么 


. getitem 


| getitem 。_() 特 殊 方法 来 实现 的 。 


Line 1, Xn T? 
py", line 21, in. getattr. 
attr) 


() 方 法 ， 且 getitme _() 没 有 作 
时 候 调 用 getattr() 呢 ? 


当 在 实例 或 类 字典 中 的 完整 搜索 失败 后 ， 就 调用 它 来 查找 一 个 成 功 的 匹配 。 你 在 上 面 可 以 看 
到 ， 对 getattrO 的 调用 就 是 失败 的 那个 ， 触 发 了 异常 。 


然而 ， 我 们 还 有 一 


种 “ 作 束 "的 方法 ， 访 问 实际 对 象 [通过 


我 们 的 get() 方 法 ] 和 它 的 切片 能 力 。 
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>>> realList = wrappedList.get () 
>>> realList[3] 
'par' 


你 现在 可 能 知道 为 什么 我 们 实现 get() 方 法 了 一 一 仅仅 是 为 了 我 们 需要 取得 对 原 对 象 进行 访问 
这 种 情况 ， 我 们 可 以 从 访问 调用 中 直接 访问 对 象 的 属性 ， 而 忽略 局 部 变量 〈realList ) 


>>> wrappedList.get()[3] 


"har" 
get() 方 法 返回 一 个 对 象 ， 随 后 被 索引 以 得 到 切片 片段 。 


>>> f = WrapMe (open('/etc/motd')) 

»»» f 

«wrapMe.WrapMe object at 0x40215dac» 

>>> f.get() 

«open file '/etc/motd', mode 'r' at 0x40204ca0» 


>>> f.readline() 


'Have a lot of fun...012' 

»»» f.tell() 

21 

>>> f.seek(0) 

>>> print f.readline(), 

Have a lot of fun... 

>>> f.close() 

>>> f.get() 

«closed file '/etc/motd', mode 'r' at 0x40204ca0» 


一 旦 你 熟悉 了 对 象 的 属性 ， 你 就 能 够 开始 理解 一 些 信息 片段 从 何 而 来 ， 能 够 利用 新 得 到 的 知 
识 来 重复 功能 : 
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>>> print "«$s file $s, mode $s at $€x»" $ \ 
(f.closed and 'closed' or 'open', 'f.name' 

'f.mode', id(f.get())) 
«closed file '/etc/motd', mode 'r' at 80e95e0» 
这 总 结 了 我 们 的 简单 包装 类 的 例子 。 我 们 还 刚 开 始 接触 使 用 类 型 模拟 来 进行 类 自 定 义 。 你 将 
会 发 现 你 可 以 进行 无 限 多 的 改进 ， 来 进一步 增加 你 的 代码 的 用 途 。 一 种 改进 方法 是 为 对 象 添 
加 时 间 戳 。 在 下 一 小 节 中 ， 我 们 将 对 我 们 的 包装 类 增加 另 一 个 维度 (dimension) : 
2.8 3g EU LEX 

创建 时 间 、 修 改 时 间 和 访问 时 间 是 文件 的 几 个 常见 属性 ， 但 并 不 是 说 你 不 能 为 对 象 加 上 这 类 


信息 ， 半 竟 一 些 应 用 能 因 有 这 些 额外 信息 而 受益 。 


如 果 你 对 使 用 这 三 类 时 间 顺 序 (chronological) 数据 还 不 熟 ， 我 们 将 会 对 它们 进行 解释 。 创 建 
时 间 (或 ‘ctime’) 是 实例 化 的 时 间 ， 修 改 时 间 (或 mtime’) 指 的 是 核心 数据 升级 的 时 间 [ 通 常 

会 调用 新 的 set() 方 法 ]， 而 访问 时 间 (或 ‘atime’) 是 最 后 一 次 对 象 的 数据 值 被 获取 或 者 属性 被 

访问 时 的 时 间 改 。 


更 新 我 们 前 面 定 义 的 类 ， 可 以 创建 一 个 模块 twrapme.py， 看 例 13.7。 


如 何 更 新 这 些 代码 呢 ? 好， 首先 ， 你 将 会 发 现 增 加 了 三 个 新 方法 : gettimeval()、gettimestr() 
和 set()。 我 们 还 增加 数 行 代码 ， 根 据 所 执行 的 访问 类 型 ， 更 新 相应 的 时 间 改 。 


例 13.7 包装 标准 类 型 (twrapme.py) 


类 定义 包装 了 任何 内 建 类 型 ， 增 加 时 间 属 性 ; get()，set()， 还 有 字符 串 表示 的 方法 ; 授权 所 
有 保留 的 属性 ， 访 问 这 些 标准 类 型 。 
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$!/usr/bin/env python 


from time import time, ctime 


class TimedWrapMe (object): 


def » init 3 (self, obj): 
self. data * obj 
self. | ctime = self.  mtime = X 


self. atime = time() 


def get(self): 
self. atime = time() 


return self. data 


def gettimeval(self, t type): 
if not isinstance(t type, str) or \ 
t type[0] not in 'cma': 
raise TypeError, \ 
"argument of 'c', 'm', or 'a' req'd" 
return getattr (self, ' às S*stime' *$ ^ 


(self. class, .. name, , t type[0])) 


def gettimestr(self, t type): 


return ctime(self.gettimeval(t type)) 


def set(self, obj): 
self. | data = obj 


self. mtime = self. _ atime = time() 


def repr (self): 4 repr() 
self. — atime = time() 


return 'self.  data' 


def str | (self): # stri) 
self.  atime = time() 


return strí(self. data) 


def » getattr . (self, attr): 4 delegate 
self.  atime * time() 


return getattr (self. data, attr) 


gettimeval() 方 法 带 一 个 简单 的 字符 参数 ，“c”、“m” 或 “a”， 相 应 地 ， 对 应 于 创建 、 修 改 或 访问 
时 间 ， 并 返回 相应 的 时 间 ， 以 一 个 浮 点 值 保存 。gettimestr() 仅 仅 返 回 一 个 经 time.ctime() 元 数 
格式 化 的 打印 良好 的 字符 囊 形式 的 时 间 。 


为 新 的 模块 作 一 个 测试 驱动 。 我 们 已 看 到 授权 是 如 何 工作 的 ， 所 以 ， 我 们 将 包装 没有 属性 的 


对 象 ， 来 突出 刚 加 入 的 新 的 功能 。 在 例子 中 ， 我 们 包装 了 
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一 个 整 型 ， 然 后 将 其 改 为 字符 囊 。 
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>>> timeWrappedObj = TimedWrapMe (932) 
>>> timeWrappedObj.gettimestr('c') 
'Wed Apr 26 20:47:41 2006' 
>>> timeWrappedObj.gettimestr('m') 
'Wed Apr 26 20:47:41 2006' 
>>> timeWrappedObj.gettimestr('a') 
'Wed Apr 26 20:47:41 2006' 
>>> timeWrappedObj 
932 
>>> timeWrappedObj.gettimestr('c') 
'Wed Apr 26 20:47:41 200e6' 
>>> timeWrappedCbj.gettimestr('m') 
'Wed Apr 26 20:47:41 2006' 
>>> timeWrappedObj.gettimestr('a') 
'Wed Apr 26 20:48:05 2006' 

你 将 注意 到 ， 一 个 对 象 在 第 一 次 被 包装 时 ， 创 建 、 人 和 修改 及 最 后 一 次 访问 时 间 都 是 一 样 的 。 一 


旦 对 象 被 访问 ， 访 问 时间 即 被 更 新 ， 但 其 他 的 没有 动 。 如 果 使 用 set() 来 置换 对 象 ， 则 修改 和 
最 后 一 次 访问 时 间 会 被 更 新 。 例 子 中 ， 最 后 是 对 对 象 的 读 访 问 操作 。 
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>>> timeWrappedObj.set('time is up!!') 
>>> timeWrappedObj.gettimestr('m') 
'Wed Apr 26 20:48:35 2006' 

>>> timeWrappedObj 

'time is up!' 

>>> timeWrappedObj.gettimestr('c') 
'Wed Apr 26 20:47:41 2006' 

>>> timeWrappedObj.gettimestr('m') 
'Wed Apr 26 20:48:35 2006' 

>>> timeWrappedObj.gettimestr('a') 
'Wed Apr 26 20:48:46 2006' 


改进 包装 一 个 特殊 对 外 


下 一 个 例子 ， 描 述 了 一 个 包装 文件 对 象 的 类 。 我 们 的 类 与 一 般 带 一 个 异常 的 文件 对 象 行为 完 
全 一 样 : 在 写 模 式 中 ， 字 符 串 只 有 全 部 为 大 写 时 才 写 入 文件 。 


这 里 我 们 要 解决 的 问题 是 ， 当 你 正在 写 一 个 文本 文件 ， 其 数据 可 能 会 被 一 台大 型 机 读 取 。 很 
多 老式 机 器 在 处 理 时 严格 要 求 大 写字 母 ， 所 以 我 们 要 实现 一 个 文件 对 象 ， 其 中 所 有 写 入 文件 
的 文本 会 自动 转化 为 大 写 ， 程 序 员 就 不 必 担心 了 。 


事实 上 ， 唯 一 值得 注意 的 不 同 点 是 并 不 使 用 open() 内 建 函 数 ， 而 是 调用 CapOpen 类 时 行 初始 
化 ， 尽 管 参数 同 open() 完 全 一 样 。 


例 13.8 展 示 那 段 代 码 ， 文 件 名 是 capOpen.py。 下 面 看 一 下 例子 中 是 如 何 使 用 这 个 类 的 : 
>>> f = CapOpen('/tmp/xxx', 'w') 
>>> f.write('delegation exampleMn') 


>>> f.write('faye is goodMn') 


>>> f.write('at delegatingMn') 
>>> f.close() 
dos q 


«closed file '/tmp/xxx', mode 'w' at 12c230» 
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4113.8 包装 文件 对 象 (capOpen.py ) 


这 个 类 扩充 了 《Python FAQ》 中 的 一 个 例子 ， 提 供 一 个 文件 类 对 象 ， 定 制 write() 方 法 ， 同 
时 ， 给 文件 对 象 授权 其 他 的 功能 。 


1 #!/usr/bin/env python 

2 

3 class CapOpen(object): 

å def _init_ (self, fn, mode='r', buf--1): 
5 self.file - open(fn, mode, buf) 
6 

7 def str J (self): 

8 return str(self.file) 

9 

10 def repr  J (self): 

11 return 'self.file' 

12 

13 def write(self, line): 

14 self.file.write(line.upper()) 
15 

16 def getattr (self, attr): 

17 return getattr(self.file, attr) 


可 以 看 到 ， 唯 一 不 同 的 是 第 一 次 对 CapOpen() 的 调用 ， 而 不 是 open()。 如 果 你 正 与 一 个 实际 文 
件 对 象 ， 而 非 行为 像 文 件 对 象 的 类 实例 进行 交互 ， 那 么 其 他 所 有 代码 与 你 本 该 做 的 是 一 样 

的 。 除 了 write()， 所 有 属性 都 已 授权 给 文件 对 象 。 为 了 确定 代码 是 否 正确 ， 我 们 加 载 文件 ， 并 
显示 其 内 容 ( 注 : 可 以 使 用 open() 或 CapOpen()， 这 里 因 在 本 例 中 用 到 ， 所 以 选用 
CapOpen()) ° 


2 
>>> for eachLine in f: 


nas print eachLine, 


DELEGATION EXAMPLE 
FAYE IS GOOD 
AT DELEGATING 


13.46 新 式 类 的 高 级 特性 (Python 2.2*) 


13.16.1 新 式 类 的 通用 特性 


我 们 已 提 讨 论 过 有 关 新 式 类 的 一 些 特 性 。 由 于 类 型 和 类 的 统一 ， 这 些 特性 中 最 重要 的 是 能 够 
子 类 化 Python 数据 类 型 。 其 中 一 个 副作用 是 ， 所 有 的 Python 内 建 的 “casting”" 或 转换 函数 现在 
都 是 工厂 函数 。 当 这 些 函 数 被 调用 时 ， 你 实际 上 是 对 相应 的 类 型 进行 实例 化 。 


下 面 的 内 建 函 数 ， 追 随 Python 多 日 ， 都 已 “悄悄 地 (也 许 不 是 ) "转化 为 工厂 函数 : 
e int(), long(), float(), complex() 
E str(), unicode() 
ə List (y tuplé() 
° type () 


还 有 ， 加 入 了 一 些 新 的 函数 来 管理 这 些 “ 散 兵 游 勇 ”: 
e basestring() [2] 
e dict() 
e bool() 
e set() [3] 


e object() 


classmethod() 


staticemethod() 
e super() 

e property() 

e file() 


这 些 类 名 及 工厂 函数 使 用 起 来 ， 很 灵活 。 不 仅 能 够 创建 这 些 类 型 的 新 对 象 ， 它 们 还 可 以 用 来 
作为 基 类 ， 去 子 类 化 类 型 ， 现 在 还 可 以 用 于 isinstance() 内 建 函 数 。 使 用 isinstance() 能 够 用 于 
替换 用 烦 了 的 昌 风 格 ， 而 使 用 只 需 少 量 函 数 调用 就 可 以 得 到 清晰 代码 的 新 风格 。 上 比如， 为 测 
试 一 个 对 象 是 否 是 一 个 整 型 ， 旧 风格 中 ， 我 们 必须 调用 type() 两 次 或 者 import 相 关 的 模块 并 使 
用 其 属性 ; 但 现在 只 需要 使 用 isinstance()， 其 至 在 性 能 上 也 有 所 超越 : 


OLD (not as good): 


e if type(obj) type (0)... 


e if type (obj) types.IntType.. 
BETTER: 
e if type(obj) is type (0)... 


EVEN BETTER: 
E if isinstance(obj, int)... 
e if isinstance(obj, (int, long)).. 


e if type(obJj) is int. 





记 住 : 尽管 isinstance() 很 灵活 ， 但 它 没 有 执行 “严格 匹配 "比较 一 一 如 果 obj 是 一 个 给 定 类 型 的 
实例 或 其 子 类 的 实例 ， 也 会 返回 True。 但 如 果 想 进行 严格 匹配 ， 你 仍然 需要 使 用 is 操 作 符 。 


请 复习 13.12.2 节 中 有 关 isinstance() 的 深入 解释 ， 还 有 在 第 4 章 中 介绍 这 些 调用 是 如 何 随同 
Python 的 变化 而 变化 的 。 


13.16.2 slots 类 属性 


字典 位 于 实例 的 “心脏 "。_ dict 属性 跟踪 所 有 实例 属性 。 举 例 来 说 ， 你 有 一 个 实例 inst， 它 
有 一 个 属性 foo， 那 使 用 inst.foo 来 访问 它 与 使 用 inst， dict_[foo'] 来 访问 是 一 致 的 。 


字典 会 占据 大 量 内 存 ， 如 果 你 有 一 个 属性 数量 很 少 的 类 ， 但 有 很 多 实例 ， 那 么 正好 是 这 种 情 
况 。 为 内 存 上 的 考虑 ， 用 户 现在 可 以 使 用 _ slots 属 性 来 替代 dict o 


基本 上 ， slots ”是 一 个 类 变量 ， 由 一 序列 型 对 象 组 成 ， 由 所 有 合法 标识 构成 的 实例 属性 的 
集合 来 表示 。 它 可 以 是 一 个 列表 ， 元 组 或 可 迭代 对 象 。 也 可 以 是 标识 实例 能 拥有 的 唯一 的 属 
性 的 简单 字符 串 。 任 何 试图 创建 一 个 其 名 不 在 _ slots ”中 的 名 字 的 实例 属性 都 将 导致 
AttributeErrorr 3$ : 


class SlottedClass (object): 
slots . m: ['foo', Dar" 


>>> c = SlottedClass() 


>>> 
>>> c.foo = 42 
>>> c.xxx dont think so" 


Traceback (most recent call last): 
File "4stdin»", iine 1. in. ? 
AttributeError: 'SlottedClass' object has no attribute 


xxx" 


这 种 特性 的 主要 目的 是 节约 内 存 。 其 副作用 是 某 种 类 型 的 “安全 "， 它 能 防止 用 户 随 心 所 和 欲 的 动 
态 增加 实例 属性 。 带 _ slots 属 性 的 类 定义 不 会 存在 dict 了 (除非 你 在 ”slots — T? 

Jw dict "GL €) 。 更 多 有 关 slots ”的 信息 ， 请 参见 《Python (语言 ) 参考 手册 》 
(Python (Language) Reference Manual) 中 有 关 数 据 模型 章节 。 


13.16.3 __getattribute _() 特 殊 方 法 


Python 类 有 一 个 名 为 ”getattr () 的 特殊 方法 ， 它 仅 当 属 性 不 能 在 实例 的 ”dict 或 它 的 类 
(类 的 _dict ) ， 或 者 祖先 类 (其 _dict ) 中 找到 时 ， 才 被 调用 。 我 们 曾 在 实现 授权 中 看 
到 过 使 用 _getattr ()» 


很 多 用 户 碰 到 的 问题 是 ， 他们 想 要 一 个 适当 的 函数 来 执行 每 一 个 属性 访问 ， 不 光 是 当 属 性 不 
能 找到 的 情况 。 这 就 是 _getattribute ”() 用 武之 处 了 。 它 使 用 起 来 ， 类 似 ”getattr ()， 不 同 
之 处 在 于 ， 当 属性 被 访问 时 ， 它 就 一 直 都 可 以 被 调用 ， 而 不 局 限于 不 能 找到 的 情况 。 


如 果 类 同时 定义 了  getattribute ()/&  getattr () 方 法 ， 除 非 明确 从 get-attribute() 调 用 ， 
X getattribute _() 引 发 了 AttributeError 异 常 ， 否 则 后 者 不 会 被 调用 。 


如 果 你 将 要 在 此 ( 译 者 注 : getattrbute (F) 访问 这 个 类 或 其 祖先 类 的 属性 ， 请 务必 小 
心 。 如 果 你 在 _ getattribute__() 中 不 知 何故 再 次 调用 了 _getattribute _()， 你 将 会 进入 无 穷 递 
归 。 为 避免 在 使 用 此 方法 时 引起 无 穷 递 归 s， 为 了 安全 地 访问 任何 它 所 需要 的 属性 ， 你 总 是 应 
该 调用 祖先 类 的 同名 方法 ; 比如 ，super (objself) . getattribute — (attr) 。 此 特殊 方法 只 
在 新 式 类 中 有 效 。 同 ”slots 一样 ， 你 可 以 参考 《Python (语言 ) 参考 手册 》 中 数据 模型 章 
节 ， 以 得 到 更 多 有 关 getattribute _() 的 信息 。 


13.16.4 ”描述 符 


a oc se 
表示 对 象 属性 的 一 个 代理 。 当 需要 属性 时 ， 可 根据 你 允 到 的 情况 ， 通 过 描述 答 (如 果 有 ) 或 
者 采用 常规 方式 句点 属性 标识 法 ) 来 访问 它 


Ao d 85. SOR ANGE 0 GELELXAIHMANGSUR — "get A HE (实际 写法 为 _get ) ， 当 这 个 代理 被 调 
用 时 ， 你 就 可 以 访问 这 个 对 象 了 。 当 你 试图 使 用 描述 符 (set) 给 一 个 对 象 赋值 或 删除 一 个 属 
性 (delete) 时 ， 这 同样 适用 。 


1. get (^ set () f delete __() 特 殊 方 法 


严格 来 说 ， 描 述 符 实际 上 可 以 是 任何 (新式) 类， 这 种 类 至 少 实现 了 三 个 特殊 方法 

| get (^. set () 和 delete () 中 的 一 个 ， 这 三 个 特殊 方法 充当 描述 符 协 议 的 作用 。 网 
才 提 到 过 ， get () 可 用 于 得 到 一 个 属性 的 值 ， set () 是 为 一 个 属性 进行 赋值 的 ， 在 采用 
del 语 名 (或 其 他 ， 其 引用 计数 递减 ) 明确 删除 掉 某 个 属性 时 会 调用 delete ”_() 方 法 。 在 三 


者 中 ， 后 者 很 少 被 实现 。 
还 有 ， 也 不 是 所 有 的 描述 符 都 实现 了 ”set () 方 法 。 它 们 被 当 作 方法 描述 符 ， 或 者 更 准确 地 
说 ， 是 非 数据 描述 符 来 被 引用 。 那 些 同时 窗 盖 ”get () 和 set () 的 类 被 称 作 数 据 描述 符 ， 
它 比 非 数 据 描述 符 要 强大 些 。 
. get () set ()& delete () 的 原型 如 下 所 示 : 

o def _ get__ (self, obj, typ=None) 一 value 

o def set (self, obj, val) = None 

? def delete (self, obj) >> None 
如 果 你 想 要 为 一 个 属性 写 个 代理 ， 必 须 把 它 作为 一 个 类 的 属性 ， 让 这 个 代理 来 为 我 们 做 所 有 
的 工作 。 当 你 用 这 个 代理 来 处 理 对 一 个 属性 的 操作 时 ， 你 会 得 到 一 个 描述 符 来 代理 所 有 的 郊 
数 功 能 。 我 们 在 前 面 的 一 节 中 已 经 讲 过 封装 的 概念 。 这 里 我 们 会 进一步 来 探讨 封装 的 问题 。 
现在 让 我 们 来 处 理 更 加 复杂 的 属性 访问 问题 ， 而 不 是 将 所 有 任务 都 交 给 你 所 写 的 类 中 的 对 象 
1i] o 
2. getattribute _() 特 殊 方法 (2) 
使 用 描述 符 的 顺序 很 重要 ， 有 一 些 描述 符 的 级 别 要 高 于 其 他 的 。 整 个 描述 符 系统 的 心脏 是 
. getattribute _()， 因 为 对 每 个 属性 的 实例 都 会 调用 到 这 个 特殊 的 方法 。 这 个 方法 被 用 来 查找 
类 的 属性 ， 同 时 也 是 你 的 一 个 代理 ， 调 用 它 可 以 进行 属性 的 访问 等 操作 。 


对 象 。 举 例 来 说 ， 给 定 类 X 和 实例 x，x.foo 由 getattribute _() 转 化 成 : 


tvpe(x).. dict. [*'foo']. get (x, type(x)) 


如 果 类 调用 了 get () 方 法 ， 那 么 None 将 作为 对 象 被 传 入 (对 于 实例 ， 传 入 的 是 self) 


A. Mret ["Too ls . wget . (None, X) 


最 后 ， 如 果 super() 被 调用 了 ， 比 如 ， 给 定 Y 为 X 的 子 类 ， 然 后 用 super (Yobj) .foo 在 
obj. class . mro 中 紧 接 类 Y 沿 着 继承 树 来 查找 类 X， 然 后 调用 : 


Ka Tet 5 


然后 ， 描 述 符 会 负责 返回 需要 的 对 象 。 

3. 优 先 级 别 

由 于 _ getattribute ”() 的 实现 方式 很 特别 ， 我 们 在 此 对 ”getattribute。”() 方 法 的 执行 方式 做 一 
个 介绍 。 因 此 了 解 以 下 优先 级 别 的 排序 就 非常 重要 了 : 

e 类 属性 

。 数据 描述 符 

e 实例 属性 

。 非 数 据 描述 符 

e 默认 为 ”getattr () 

描述 符 是 一 个 类 属性 ， 因 此 所 有 的 类 属性 绰 具 有 最 高 的 优先 级 。 你 其 实 可 以 通过 把 一 个 描述 
符 的 引用 赋 给 其 他 对 象 来 替换 这 个 描述 符 。 比 它们 优先 级 别 低 一 等 的 是 实现 了 _get (fe 
_ set __() 方 法 的 描述 符 。 如 果 你 实现 了 这 个 描述 符 ， 它 会 像 一 个 代理 那样 帮助 你 完成 所 有 的 


工作 | 


否则 ， 它 就 默认 为 局 部 对 象 的 _dict 的 值 ， 也 就 是 说 ， 它 可 以 是 一 个 实例 属性 。 接 下 来 是 非 
数据 描述 符 。 可 能 第 一 次 听 起 来 会 吃惊 ， 有 人 可 能 认为 在 这 条 “食物 链 "* 上 非 数据 描述 符 应 该 比 
实例 属性 的 优先 级 更 高 ， 但 事实 并 非 如 此 。 非 数据 描述 符 的 目的 只 是 当 实 例 属性 值 不 存在 

时 ， 提 供 一 个 值 而 已 。 这 与 以 下 情况 类 似 : 当 在 一 个 实例 的 _ dict 中 找 不 到 某 个 属性 时 ， 才 
去 调用 getattr ()。 

关于 ”getattr () 的 说 明 ， 如 果 没 有 找到 非 数据 描述 符 ， 那 么 ”getattribute _() 将 会 抛 出 一 个 
AttributeError 异 常 ， 接 着 会 调用 _getattr () 作 为 最 后 一 步 操作 ， 否 则 AttributeError 会 返回 给 
用 户 。 

4. 描 述 符 举例 

让 我 们 来 看 一 个 简单 的 例子 ...... 用 一 个 描述 符 禁止 对 属性 进行 访问 或 赋值 的 请 求 。 事 实 上 ， 
以 下 所 有 示例 都 忽略 了 全 部 请 求 ， 但 它们 的 功能 逐步 增多 ， 我 们 希望 你 通过 每 个 示例 逐步 党 
握 描 述 符 的 使 用 : 
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class DevNulll(object): 
def get  J (self, obj, typ-None): 
pass 
def set J (self, obj, val): 


pass 
我 们 建立 一 个 类 ， 这 个 类 使 用 了 这 个 描述 答 ， 给 它 赋值 并 显示 其 值 : 


>>> class Cl(object): 


T foo = DevNulll() 


»os CI = CIO 
>>> cl.foo = 'bar' 
>>> print 'cl.foo contains:;', cl.foo 


cl.foo contains: None 


这 并 没有 什么 有 趣 的 ...... 让 我 们 来 看 看 在 这 个 描述 符 中 写 一 些 输出 语句 会 怎么 样 ? 


class DevNull2 (object): 


def get . (self, obj, typ*None): 
print 'Accessing attribute... ignoring' 
def set  . (self, obj, val): 
print 'Attempt to assign $r... ignoring' % (val) 


现在 我 们 来 看 看 修改 后 的 结果 : 
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>>> class C2(object): 
T foo = DevNul112() 


So c2 œ C2() 

>>> c2.foo = 'bar' 

Attempt to assign 'bar'... ignoring 
>>> x = C2.Í00 

Accessing attribute... ignoring 

=>> srint 'oc2.Ioo0 Contains; t; x 
c2.foo contains: None 


最 后 

A : 

class DevNull3 (object): 

def init  J (self, namesNone): 
self.name = name 


def | get  J (self, obj, typ-None): 


print 'Accessing [$s]... ignoring' $ 


self.name) 
def set J (self, obj, val): 
print 'Assigning $r to [$s]... ignoring' $ 


val, self.name) 


下 面 的 输出 结果 表明 我 们 前 面 提 到 的 优先 级 层次 结构 的 重要 性 ， 尤 其 是 我 们 说 过 ， 一 个 


的 数据 描述 符 比 实例 的 属性 具有 更 高 的 优先 级 : 
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后 ， 我 们 在 描述 符 所 在 的 类 中 添加 一 个 占 位 符 ， 占 位 符 包 含有 关于 这 个 描述 符 的 有 用 信 


完整 
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>>> class C3(object): 
foo = DevNull3('foo') 


>>> c3 = C3() 

>>> c3.foo = 'bar' 

Assigning 'bar' to [foo]... ignoring 

>>> x = c3.foo 

Accessing [foo]... ignoring 

>>> print 'c3.foo contains:', x 

c3.foo contains: None 

>>> print 'Let us try to sneak it into c3 instance..." 

Let us try to sneak it into c3 instance... 

52» Q3.  IOick . ['foo'] = 'bay' 

>>> x 7 c3.foo 

Accessing [foo]... ignoring 

>>> print 'c3.foo contains:', x 

c3.foo contains: None 

2»» print "c3. dict  ['foo'] contains: $r" $ VN 
03. -HIER EoD ".., why2I2" 


c3. | dict  ['foo'] contains: 'bar' ... why?!? 


请 注意 我 们 是 如 何 给 实例 的 属性 赋值 的 。 给 实例 属性 c3.foo 赋 值 为 一 个 字符 串 “bar”。 但 由 于 数 
据 描述 符 比 实例 属性 的 优先 级 高 ， 所 赋 的 值 "bar' 被 隐藏 或 履 盖 了 。 


同样 地 ， 由 于 实例 属性 比 非 数据 描述 符 的 优先 级 高 ， 你 也 可 以 将 非 数 据 描述 符 隐藏 。 这 就 和 
你 给 一 个 实例 属性 赋值 ， 将 对 应 类 的 同名 属性 隐藏 起 来 是 同一 个 道理 : 
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>>> class FooFoo(object): 
def foo(self): 


print 'Very important foo() method.' 


>>> 
>>> bar = FooFoo() 

>>> bar.foo() 

Very important foo() method. 

>>> 

>>> bar.foo = 'It is no longer here.' 
>>> bar.foo 

'It is no longer here.' 

»»» 

>>> del bar.foo 

>>> bar.foo() 


Very important foo() method. 


这 是 一 个 直 白 的 示例 。 我 们 将 foo 作 为 一 个 函数 调用 ， 然 后 又 将 它 作 为 一 个 字符 串 访 问 ， 但 我 
们 也 可 以 使 用 另 一 个 函数 ， 而 且 保持 相同 的 调用 机 制 : 
>>> def barBar(): 
print 'foo() hidden by barBar()' 


>>> bar.foo = barBar 
>>> bar.foo() 

foo() hidden by barBar() 
>>> 

>>> del bar.foo 

»»» bar.foo() 


Very important foo() method. 


要 强调 的 是 : 函数 是 非 数据 描述 符 ， 实 例 属性 有 更 高 的 优先 级 ， 我 们 可 以 迹 蔽 任 一 个 非 数据 
描述 符 ， 只 需 简单 的 把 一 个 对 象 赋 给 实例 (使 用 相同 的 名 字 ) 就 可 以 了 。 
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我 们 最 后 这 个 示例 完成 的 功能 更 多 一 些 ， 它 尝试 用 文件 系统 保存 一 个 属性 的 内 容 ， 这 是 个 维 
形 版 本 。 


1~ 10 行 


在 引入 相关 模块 后 ， 我 们 编写 一 个 描述 符 类 ， 类 中 有 一 个 类 属性 (saved) ， 它 用 来 记录 描述 
符 访 问 的 所 有 属性 。 描 述 符 创建 后 ， 它 将 注册 并 且 记录 所 有 从 用 户 处 接收 的 属性 名 。 


12 ~ 26 行 


在 获取 描述 符 的 属性 之 前 ， 我 们 必须 确保 用 户 给 它们 赋值 后 才能 使 用 。 如 果 上 述 条 件 成 立 ， 
接着 我 们 将 尝试 打开 pickle 文 件 以 读 取 其 中 所 保存 的 值 。 如 果 文 件 打 开 失 败 ， 将 引发 一 个 异 
常 。 文 件 打开 失败 的 原因 可 能 有 以 下 几 种 : 文件 已 被 删除 了 (或 从 未 创建 过 ) ， 或 是 文件 已 
损坏 ， 或 是 由 于 某 种 原因 ， 不 能 被 pickle 模 块 反 串 行 化 。 

18 ~ 38 行 

将 属性 保存 到 文件 中 需要 经 过 以 下 几 个 步骤 : 打开 用 于 写 入 的 pickle 文 件 (可 能 是 首次 创建 一 
个 新 的 文件 ， 也 可 能 是 删 掉 昌 的 文件 ) ， 将 对 象 串 行 化 到 磁盘 ， 注 册 属性 名 ， 使 用 户 可 以 读 
取 这 些 属 性 值 。 如 果 对 象 不 能 被 pickle， 将 引发 一 个 异常 。 注 意 ， 如 果 你 使 用 的 是 Python2.5 
以 前 的 版 本 ， 你 就 不 能 合并 try-except 和 try-finally 语 句 (第 30~38 行 ) ° 

例 13.9 使 用 文件 来 存储 属性 (descr.py) 

这 个 类 是 一 个 维 形 ， 但 它 展示 了 描述 符 的 一 个 有 趣 的 应 用 一 一 可 以 在 一 个 文件 系统 上 保存 属 
性 的 内 容 。 


#!/usr/bin/env python 


import os 


1 
2 
3 
ü import pickle 
5 
6 


class FileDescr(object): 


7 saved = [] 

8 

9 def init (self, name-zNone): 

10 self.name = name 

11 

12 def — get  . (self, obj, typ-None): 

13 if self.name not in FileDescr.saved: 


14 raise AttributeError, \ 
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15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 


40 ~ 4541 


最 后 ， 如 果 属 性 被 删除 了 ， 文 件 会 被 删除 ， 属 性 名 字 也 会 被 注销 。 以 下 是 这 个 类 的 用 法 示 


f| : 


"$r used before assignment" $ self.name 


try: R 
f = open(self.name, 'r') 
val = pickle.load(f) 
f.close() 
return val 
except(pickle.UnpicklingError, IOError, 
EOFError, AttributeError, 
ImportError, IndexError), e: 
raise AttributeError, ^ 
"could not read $r: $s” $ self.name 


def _set (self, obj, val): 


f = open(self.name, 'w') 


pickle.dump(val, f) 
FileDescr.saved.append(self.name) 
except (TypeError, pickle.PicklingError), e: 
raise AttributeError, * 
"could not pickle èr” % self.name 
finally: 
f.close() 


def delete X (self, obj): 


try: 
os.unlink(self.name) 
FileDescr.saved.remove (self.name) 


except (OSError, ValueError), e: 
pass 


第 13 章 “面向 对 象 编程 


605 


Python 核心 编程 第 二 版 


>>> class MyFileVarClass (object): 
id foo = FileDescr('foo') 


"E bar - FileDescr('bar') 


>>> fvc = MyFileVarClass() 
>>> print fvc.foo 
Traceback (most recent call last): 
File "«stdin»", line 1, in ? 
File "descr.py", line 14, in, get. 
raise AttributeError, \ 


AttributeError: 'foo' used before assignment 


»»» 
>>> fvc.foo = 42 
>>> fvc.bar = 'leanna' 


>>> 


»»» print fvc.foo, fvc.bar 
42 leanna 
>>> 
>>> del fvc.foo 
>>> print fvc.foo, fvc.bar 
Traceback (most recent call last): 
File "«stdin»", line 1, in ? 
File "descr.py", line 14, in get _ 
raise AttributeError, \ 
AttributeError: 'foo' used before assignment 
>>> 
>>> fvc.foo =  builtins 
Traceback (most recent call last): 
File "«stdin»", line 1l, in ? 
File "descr.py", line 35, in. set. 
raise AttributeError, \ 


AttributeError: could not pickle 'foo' 
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属性 访问 没有 什么 特别 的 ， 程 序 员 并 不 能 准确 判断 一 个 对 象 是 否 能 被 打包 后 存储 到 文件 系统 
中 (除非 如 最 后 示例 所 示 ， 将 模块 pickle， 我 们 不 该 这 样 做 ) o RILA S T AE EGE A] 
来 处 理 文件 损坏 的 情况 。 在 本 例 中 ， 我 们 第 一 次 在 描述 符 中 实现 _delete () 方 法 。 


请 注意 ， 在 示例 中 ， 我 们 并 没有 用 到 obj 的 实例 。 别 把 obj 和 self 搞 混淆 ， 这 个 self 是 指 描述 符 的 
实例 ， 而 不 是 类 的 实例 。 


5. 描 述 符 总 结 


你 已 经 看 到 描述 符 是 怎么 工作 的 。 静 态 方法 、 类 方法 、 属 性 ( 见 下 面 一 节 ) ， 其 至 所 有 的 元 
数 都 是 描述 符 。 想 一 想 : 泡 数 是 Python 中 常见 的 对 象 。 有 内 置 的 防 数 、 用 户 自 定义 的 函数 、 
类 中 定义 的 方法 、 静 态 方法 、 类 方法 。 这 些 都 是 函数 的 例子 。 它 们 之 间 唯 一 的 区 别 在 于 调用 
方式 的 不 同 。 通 常 ， 函 数 是 非 绑 定 的 。 虽 然 静 坊 方法 是 在 类 中 被 定义 的 ， 它 也 是 非 绑 定 的 。 
但 方法 必须 绑 定 到 一 个 实例 上 ， 类 方法 必须 绑 定 到 一 个 类 上 。 一 个 函数 对 象 的 描述 符 可 以 处 
理 这 些 问 题 ， 描 述 符 会 根据 函数 的 类 型 确定 如 何 “ 封 装 "这 个 函数 和 函数 被 绑 定 的 对 象 ， 然 后 返 
回调 用 对 象 。 它 的 工作 方式 是 这 样 的 : 函数 本 身 就 是 一 个 描述 符 ， 函 数 的 _get_() 方 法 用 来 
处 理 调用 对 象 ， 并 将 调用 对 象 返 回 给 你 。 描 述 符 具 有 非常 棒 的 适用 性 ， 因 此 从 来 不 会 对 
Python 自己 的 工作 方式 产生 影响 。 


6. 属 性 和 property() 内 建 函 数 


属性 是 一 种 有 用 的 特殊 类 型 的 描述 符 。 它 们 是 用 来 处 理 所 有 对 实例 属性 的 访问 ， 其 工作 方式 
和 我 们 前 面 说 过 的 描述 符 相似 。" 一 般 " 情 况 下 ， 当 你 使 用 点 属性 符号 来 处 理 一 个 实例 属性 时 ， 
其 实 你 是 在 修改 这 个 实例 的 _dict 属性 。 


表面 上 来 看 ， 你 使 用 property() 访 问 和 一 般 的 属性 访问 方法 没有 什么 不 同 ， 但 实际 上 这 种 访问 
的 实现 是 不 同 的 一 一 它 使 用 了 函数 〈 或 方法 ) 。 在 本 章 的 前 面 ， 你 已 看 到 在 Python 的 早期 版 
本 中 ， 我 们 一 般 用 _getattr _() 和 _ setattr () 来 处 理 和 属性 相关 的 问题 。 属 性 的 访问 会 涉及 
以 上 特殊 的 方法 (和 getattribute ()) ， 但 是 如 果 我 们 用 property() 来 处 理 这 些 问题 ， 你 就 
可 以 写 一 个 和 属性 有 关 的 函数 来 处 理 实例 属性 的 获取 (getting) ^ 9&4& (setting) 和 删除 

(deleting) 操作 ， 而 不 必 再 使 用 那些 特殊 的 方法 了 (如果 你 要 处 理 大 量 的 实例 属性 ， 使 用 那 
些 特殊 的 方法 将 使 代码 变 得 很 腑 肿 ) 。 


property() 内 建 泡 数 有 四 个 参数 ， 它 们 是 : 
property(fget-None, fset=None, fdel=None, doc=None) 


请 注意 property() 的 一 般 用 法 是 ， 将 它 写 在 一 个 类 定义 中 ，property() 接 受 一 些 传 进来 的 函数 
(其 实 是 方法 ) 作为 参数 。 实 际 上 ，property() 是 在 它 所 在 的 类 被 创建 时 被 调用 的 ， 这 些 传 进 
来 的 (作为 参数 的 ) 方法 是 非 绑 定 的 ， 所 以 这 些 方法 其 实 就 是 函数 | 


下 面 的 例子 在 类 中 建立 一 个 只 读 的 整 型 属性 ， 用 逐 位 异 或 操作 符 将 它 隐 藏 起 来 : 
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class ProtectAndHideX (object): 
daf |. init (Sel x): 
assert isinstance(x, int), \ 
'"x" must be an integer!' 


self. x = ~x 


def get x(self): 


return -self. x 


X = property(get x) 


我 们 来 运行 这 个 例子 ， 会 发 现 它 只 保存 我 们 第 一 次 给 出 的 值 ， 而 不 允许 我 们 对 它 做 第 二 次 修 


PC 


>>> inst = ProtectAndHideX('foo') 
Traceback (most recent call last): 
File "€stdin»", line 1, in ? 
Fille "prop.py"; line 5, in. init. 
assert isinstance(x, int), \ 
AssertionError: "x" must be an integer! 
>>> inst = ProtectAndHideX (10) 
2250 print "INSE S -', i1BsSt.X 
inst.x = 10 
>>> inst.x = 20 
Traceback (most recent call last): 
File "«stdin»", line 1l, in ? 


AttributeError: can't set attribute 


下 面 是 另 一 个 关于 setter 的 例子 : 
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class HideX(object): 
def 3— init — (self, x): 


self.x = x 


def get x(self): 


return -self. x 


def set x(self, x): 


assert isinstance(x, int), \ 


'"xX" must be an integer!' 


self. X= ~x 


x = property(get x, set x) 
本 示例 的 输出 结果 : 


>>> inst = HideX(20) 
>>> print inst.x 
20 


P5» 1nst.x = 30 
>>> nrint'inst.x 


30 


[& 1 5,223 VR £8 Sic 3E ER OR o EI A AA A A 3€ 2S 28 X 30 36 4& S]? Je getterP 6,22 dE - Xn 
给 了 self. x» 


你 还 可 以 给 自己 号 的 属性 添加 一 个 文档 字符 串 ， 参 见 下 面 这 个 例子 : 
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from math import pi 


def get pi (dummy): 


return pi 


class PI(object): 
pi = property(get pi, doc-'Constant "pi"') 


为 了 说 明 这 是 可 行 的 实现 方法 ， 我 们 在 property 中 使 用 的 是 一 个 函数 而 不 是 方法 。 注 意 在 调用 
函数 时 self 作 为 第 一 个 (也 是 唯一 的 ) 参数 被 传 入 ， 所 以 我 们 必须 加 一 个 伪 变 量 把 self 丢 弃 。 
下 面 是 本 例 的 输出 : 


>>> inst = PI() 
=>> Angt.pi 
3.1415926535897931 


225» print PI.pi. doc 


Constant "pi" 


你 明白 properties 是 如 何 把 你 写 的 函数 (fget ^ fsetfefdel) 影射 为 描述 符 的 _get ()^ 
set (Me delete _() 方 法 的 吗 ? 你 不 必 写 一 个 描述 符 类 ， 并 在 其 中 定义 你 要 调用 的 这 些 方 


法 。 只 要 把 你 写 的 函数 〈 或 方法 ) 全 部 传递 给 property() 就 可 以 了 。 


在 你 写 的 类 定义 中 创建 描述 符 方 法 的 一 个 弊端 是 它 会 摘 乱 类 的 名 字 空 间 。 不 仅 如 此 ， 这 种 做 

法 也 不 会 像 property() 那 样 很 好 地 控制 属性 访问 。 如 果 不 用 property() 这 种 控制 属性 访问 的 目的 

就 不 可 能 实现 。 我 们 的 第 二 个 例子 没有 强制 使 用 property()， 因 为 它 允许 对 属性 方法 的 访问 
(由 于 在 类 定义 中 包含 属性 方法 ) 


>>> inst.set x(40) # can we require inst.x = 40? 
>>> print inst.x 


40 


APNPC (ActiveState Programmer Network Python Cookbook, 
http://aspn.activestate.com/ASPN/Cookbook/Python/Recipe/205183) 上 的 一 个 聪明 的 办 法 
解决 了 以 下 问题 : 


e “借用 "一 个 函数 的 名 字 空 间 ; 

e 编写 一 个 用 作 内 部 函数 的 方法 作为 property() 的 (关键 字 ) 参数 ; 

e (用 locals()) 返回 一 个 包含 所 有 的 (函数 /方法 ) 名 和 对 应 对 象 的 字典 ; 
e 把 字典 传 入 property() : 

e 然后 ， 去 掉 临 时 的 名 字 空 间 。 


这 样 ， 方 法 就 不 会 再 把 类 的 名 字 空 间 摘 乱 了 ， 因 为 定义 在 内 部 函数 中 的 这 些 方法 属于 其 他 的 
名 字 空 间 。 由 于 这 些 方法 所 属 的 名 字 空 间 已 超出 作用 范围 ， 用 户 是 不 能 够 访问 这 些 方法 的 ， 

所 以 通过 使 用 属性 property() 来 访问 属性 就 成 为 了 唯一 可 行 的 办 法 。 根 据 APNPC 上 的 方法 ， 我 
们 来 修改 这 个 类 : 


class HideX(object): 
def _ init. (self, x): 


self.x = x 


Gproperty 
def x(): 
def fget(self): 


return -self. x 


def fset (self, x): 
assert isinstance(x, int), \ 
'"xX" must be an integer!' 


self. x = -x 


return locals() 


我 们 的 代码 工作 如 初 ， 但 有 两 点 明显 不 同 : (1) 类 的 名 字 空 间 更 加 简洁 ， 只 有 

[ doc '*' init '*' module > x]; (2) 用 户 不 能 再 通过 inst.set x (40) 给 属性 赋 
值 ， 必 须 使 用 init.x=40。 我 们 还 使 用 遂 数 修饰 符 (property) PARTERET- Ad 
象 。 由 于 修饰 符 是 从 Python2.4 版 本 开始 引入 的 ， 如 果 你 使 用 的 是 Python 的 早期 版 本 2.2.X 或 
2.3.x， 请 将 修饰 符 @property 去 掉 ， 在 x() 的 函数 声明 后 添加 Xx=property (**x()) ° 


13.16.5 元 类 和 metaclass _ 


126, € (Metaclasses) 是 什么 


元 类 可 能 是 添加 到 新 风格 类 中 最 难以 理解 的 功能 了 。 元 类 让 你 来 定义 某 些 类 是 如 何 被 创建 
的 ， 从 根本 上 说 ， 赋 予 你 如 何 创 建 类 的 控制 权 〈 你 甚至 不 用 去 想 类 实例 层面 的 东西 ) 。 早 在 
Python1.5 的 时 代 ， 人 们 就 在 谈论 这 些 功 能 (当时 很 多 人 都 认为 不 可 能 实现 ) ， 但 现在 终于 实 
ILT o 


从 根本 上 说 ， 你 可 以 把 元 类 想 成 是 一 个 类 中 类 ， 或 是 一 个 类 ， 它 的 实例 是 其 他 的 类 。 实 际 

上 ， 当 你 创建 一 个 新 类 时 ， 你 就 是 在 使 用 默认 的 元 类 ， 它 是 一 个 类 型 对 象 (对 传统 的 类 来 

说 ， 它 们 的 元 类 是 types.ClassType) 。 当 某 个 类 调用 type() 函 数 时 ， 你 就 会 看 到 它 到 底 是 谁 的 
实例 : 


class C(object): 


pass 


class CC: 


pass 


>>> type(C) 

«type 'type'» 

>>> 

>>> type (CC) 

«type 'classobj'» 

>>> 

>>> import types 

>>> type(CC) is types.ClassType 


True 


2. 什 么 时 候 使 用 元 类 


元 类 一 般 用 于 创建 类 。 在 执行 类 定义 时 ， 解 释 器 必须 要 知道 这 个 类 的 正确 的 元 类 。 解 释 器 会 
先 寻 找 类 属性 “metaclass ， 如 果 此 属性 存在 ， 就 将 这 个 属性 赋值 给 此 类 作为 它 的 元 类 。 如 
有 果 此 属性 没有 定义 ， 它 会 向 上 查找 父 类 中 的 ”metaclass 。 所 有 新 风格 的 类 如 果 没 有 任何 父 


类 ， 会 从 对 象 或 类 型 中 继承 (type (object) 当然 是 类 型 ) 。 


如 果 还 没有 发 现 “metaclass 属性， 解释 器 会 检查 名 字 为 ”metaclass “的 全 局 变量 ; 如 果 
它 存 在 ， 就 使 用 它 作为 元 类 。 否 则 ， 这 个 类 就 是 一 个 传统 类 ， 并 用 types.ClassType 作 为 此 类 
的 元 类 。 (注意 : 在 这 里 你 可 以 运用 一 些 技 巧 ...... 如 果 你 定义 了 一 个 传统 类 ， 并 且 设 置 它 的 
. metaclass ”=type， 其 实 你 是 在 将 它 升级 为 一 个 新 风格 的 类 T) 


在 执行 类 定义 的 时 候 ， 将 检查 此 类 正确 的 (一般 是 默认 的 ) 元 类 ， 元 类 (通常 ) 传递 三 个 参 
数 (到 构造 器 ) : 类 名 、 从 基 类 继承 数据 的 元 组 和 (类 的 ) 属性 字典 。 

3. 谁 在 用 元 类 

元 类 这 样 的 话题 对 大 多 数 人 来 说 属于 理论 化 或 纯 面 向 对 象 思 想 的 范畴 ， 认 为 它 在 实际 编程 中 
没有 什么 实际 意义 。 从 某 种 意义 上 讲 这 种 想法 是 正确 的 ; 但 最 重要 的 请 铭记 在 心 的 是 ， 元 类 
的 最 终 使 用 者 不 是 用 户 ， 正 是 程序 员 自己 。 你 通过 定义 一 个 元 类 来 “迫使 "程序 员 按 照 某 种 方式 
实现 目标 类 ， 这 将 既 可 以 简化 他 们 的 工作 ， 也 可 以 使 所 编写 的 程序 更 符合 特定 标准 。 

4. 元 类 何 时 被 创建 

前 面 我 们 已 提 到 创建 的 元 类 用 于 改变 类 的 默认 行为 和 创建 方式 。 大 多 数 Python 用 户 都 无 须 创 
建 或 明确 地 使 用 元 类 。 创 建 一 个 新 风格 的 类 或 传统 类 的 通用 做 法 是 使 用 系统 自己 所 提供 的 元 
类 的 默认 方式 。 

用 户 一 般 都 不 会 觉察 到 元 类 所 提供 的 创建 类 (或 元 类 实例 化 ) 的 默认 模板 方式 。 虽 然 一 般 我 
们 并 不 创建 元 类 ， 还 是 让 我 们 来 看 下 面 一 个 简单 的 例子 (关于 更 多 这 方面 的 示例 请 参见 本 节 
末尾 的 文档 列表 ) 。 

元 类 示例 1 

我 们 第 一 个 关于 元 类 的 示例 非常 简单 (希望 如 此 ) 。 它 只 是 在 用 元 类 创建 一 个 类 时 ， 显 示 时 
间 标 签 (你 现在 该 知道 ， 这 发 生 在 类 被 创建 的 时 候 ) 。 


看 下 面 这 个 脚本 。 它 包含 的 print 语 名 散落 在 代码 各 个 地 方 ， 便 于 我 们 了 解 所 发 生 的 事情 : 
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&!/usr/bin/env python 
from time import ctime 


print '*** Welcome to Metaclasses!' 


print 'MtMetaclass declaration first.' 


class MetaC (type): 
def 3 init | (cls, name, bases, attrd): 
super(MetaC, cls). |. init | (name, bases, attrd) 


print '*** Created class %r at: $s' & (name, ctime()) 
print 'MtClass "Foo" declaration next." 


class Foo(object): 
.JTmetaclass . = MetaC 
def init (self): 
print '*** Instantiated class $r at: $s' $ ( 


self. . class, .. name , ctime()) 


print 'MtClass "Foo" instantiation next.' 
f = Foo() 
print 'MtDONE' 


当 我 们 执行 此 脚本 时 ， 将 得 到 以 下 输出 : 


*** Welcome to Metaclasses! 
Metaclass declaration first. 
Class "Foo" declaration next. 

*** Created class 'Foo' at: Tue May 16 14:25:53 200€ 
Class "Foo" instantiation next. 

*** Instantiated class 'Foo' at: Tue May 16 14:25:53 2006 


DONE 


当 你 明白 了 一 个 类 的 定义 其 实 是 在 完成 菜 些 工 作 的 事实 以 后 ， 你 就 容易 理解 这 是 
WT 


元 类 示例 2 


N 


6 


AZ 


一 回 事 


在 第 二 个 示例 中 ， 我 们 将 创建 一 个 元 类 ， 要 求 程 序 员 在 他 们 写 的 类 中 提供 一 个 _str__() 方 法 
的 实现 ， 这 样 用 户 就 可 以 看 到 比 我 们 在 本 章 前 面 所 见 到 的 一 般 Python 对 象 字符 串 («object 


object atid>) 更 有 用 的 信息 。 
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如 果 你 还 没有 在 类 中 敌 盖 repr_() 方 法 ， 元 类 会 (BWA) 提示 你 这 么 做 ， 但 这 只 是 个 敬告。 
如 果 未 实现 _ str _() 方 法 ， 将 引发 一 个 TypeError 的 异常 ， 要 求 用 户 编写 一 个 同名 方法 。 以 下 
是 关于 元 类 的 代码 : 


from warnings import warn 
class ReqStrSugRepr (type): 


def init | (cls, name, bases, attrd): 
super(ReqStrSugRepr, cls). . init |. ( 


name, bases, attrd) 


i£ ' str ' not in attrd: 
raise TypeError( 
"Class requires overriding of str . ()") 
if ' repr ' not in attrd: 
warn ( 
'Class suggests overriding of , repr ()\n', stacklevel-3) 


我 们 编写 了 三 个 关于 元 类 的 示例 ， 其 中 一 个 (Foo) 重 载 了 特殊 方法 str ()fe repr ()* 
另 一 个 (Bar) 只 实现 了 特殊 方法 str ()* 还 有 一 个 (FooBar) 没有 实现 str (fe 
repr _()， 这 种 情况 是 错误 的 。 完 整 的 程序 见 示例 13.10。 


执行 此 脚本 ， 我 们 得 到 如 下 输出 : 


$ python meta.py 
*** Defined ReqStrSugRepr (meta)class 


*** Defined Foo class 


sys:l: UserWarning: Class suggests overriding of 


. repr  () 
*** Defined Bar class 


Traceback (most recent call last): 


File "meta.py", line 43, in ? 
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TypeError: Class requires overriding of str 


class FooBar (object): 
File "meta.py", line 12, in init 


raise TypeError( 


1513.10 ”将 直线 的 两 个 端点 元 类 示例 (meta.py) 


这 个 模块 有 一 个 元 类 和 三 个 受 此 元 类 限定 的 类 。 每 创建 一 个 类 ， 将 打印 一 条 输出 语句 。 


w O - o uv 6 QU N rm 


W UU QC Ww UU UL Ww FS N MN PN RO FN SOC FS ON N Mom Rm om BE om Bm 
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#!/usr/bin/env python 


from warnings import warn 


class ReqStrSugRepr (type): 


def init  (cls, name, bases, attrd): 
super(ReqStrSugRepr, cls}. init ( 
name, bases, attrd) 
if ' str ' not in attrd: 
raise TypeError( 
"Class requires overriding of str  ()") 


if ' repr..' not ín attróàd: 
warn( 
'Class suggests overriding of repr  ()M', 
stacklevel-3) 


print '*** Defined ReqStrSugRepr (meta)classAn' 


class Foo(cbject): 
.metaclass | = ReqStrSugRepr 


def «str (self): 
return 'Instance of class:', \ 
self. | class . name 


def repr — (self): 
return self. class, . name 


print '*** Defined Foo classMn' 


class Bar (object): 


.metaclass | = ReqStrSugRepr 
def  Á str — (self): 
return 'Instance of class:', \ 


self. class ., name, « 


print '*** Defined Bar class\n' 
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15 
c 


43 class FooBar(object): 
44 . metaclass - ReqStrSugRepr 
45 


46 print '*** Defined FooBar classMn' 


注意 我 们 是 如 何 成 功 声 明 Foo 定 义 的 ; 定义 Bar 时 ， 提 示警 告 repr () 未 实现 ; FooBar& él 
建 没 有 通过 安全 检查 ， 以 致 程序 最 后 没有 打印 出 关于 FooBar 的 语句 。 另 外 要 注意 的 是 我 们 并 
没有 创建 任何 测试 类 的 实例 ...... 这 些 其 至 根本 不 包括 在 我 们 的 设计 中 。 但 别 忘 了 这 些 类 本 身 
就 是 我 们 自己 的 元 类 的 实例 。 这 个 示例 只 显示 了 元 类 强大 功能 的 一 方面 。 


关于 元 类 的 在 线 文 档 众 多 ， 包 括 Python 文 档 PEPs 252 和 PEPs 253 » "What's New in Python 
2.2" 文 档 ， 名 为 "Unifying Types and Classes in Python 2.2” 的 文章 。 在 Python 2.2.3 发 布 的 主 
页 上 你 也 可 以 找到 相关 文档 的 链接 地 址 。 


13.17 相关 模块 和 文档 


我 们 在 本 章 已 经 对 核心 语言 做 了 讲述 ， 而 Python 语言 中 有 几 个 扩展 了 核心 语言 功能 的 经 典 
类 。 这 些 类 为 Python 数据 类 型 的 子 类 化 提供 了 方便 。 


User* 模 块 好 比 速 食 品 ， 方 便 即 食 。 我 们 曾 提 到 类 可 以 有 特殊 的 方法 ， 如 果实 现 了 这 些 特殊 方 
法 ， 就 可 以 对 类 进行 定制 ， 这 样 当 对 一 个 标准 类 型 封装 时 ， 可 以 给 实例 带 来 和 类 型 一 样 的 使 


UserList 和 UserDict， 还 有 新 的 UserString (从 Python1.6 版 本 开始 引入 ) 分 别 代 表 对 列表 、 字 
典 、 字 符 串 对 象 进行 封 装 的 类 定义 模块 。 这 些 模块 的 主要 用 处 是 提供 给 用 户 所 需要 的 功能 ， 
这 样 你 就 不 必 自 己 动手 去 实现 它们 了 ， 同 时 还 可 以 作为 基 类 ， 提 供 子 类 化 和 进一步 定制 的 功 
能 。Python 语 言 已 经 为 我 们 提供 了 大 量 有 用 的 内 建 类 型 ， 但 这 种 "由 你 自己 定制 "类 型 的 附加 功 
能 使 得 Python 语言 更 加 强大 。 


在 第 4 章 里 ， 我 们 介绍 了 Python 语言 的 标准 类 型 和 其 他 内 建 类 型 。types 模 块 是 进一步 学 习 
Python 类 型 方面 知识 的 好 地 方 ， 其 中 的 一 些 内 容 已 超出 了 本 书 的 讨论 范围 。types 模 块 还 定义 
了 一 些 可 以 用 于 进行 比较 操作 的 类 型 对 象 〈 这 种 比较 操作 在 Python 中 很 常见 ， 因 为 它 不 支持 
方法 的 重 载 一 这 简化 的 语言 本 身 ， 同 时 又 提供 了 一 些 工具 ， 为 看 似 欠 缺 的 地 方 添加 功 
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def foo(data): 
if isinstance(data, int): 
print 'you entered an integer' 
elif isinstance(data, str): 
print 'you entered a string' 


else: 
raise TypeError, 'only integers or strings!' 


ee 


在 某 些 情况 下 ， 这 种 接口 类 型 比 标准 操作 符 的 硬 编码 方式 更 通 

请 看 下 边 的 示例 。 在 你 阅读 代码 时 ， 请 设想 一 下 如 果 此 实现 中 使 用 的 是 一 个 个 操作 符 的 话 ， 
那 会 多 写 多 少 行 Ab 

>>> from operator import * # import all operators 


»»» vecl = [12, 24] 
l2; d 4] 


>>> vec2 
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>>> opvec = (add, sub, mul, div)  $ using +, -, *, / 
>>> for eachOp in opvec: # loop thru operators 
for i in vecl: 
for j in vec2: 
print '$s($d, $d) &d' $ VN 


(eachOp.  |name , i, j, eachOp(i, 


add(12, 2) = 14 
add(12, 3) = 15 
add(12, 4) = 16 
add(24, 2) = 26 
add(24, 3) = 27 
add(24, 4) = 28 
sub(12, 2) = 10 
sub(12, 3) = 9 

sub(12, 4) = 8 

sub(24, 2) = 22 
sub(24, 3) = 21 
sub(24, 4) = 20 
mul(12, 2) = 24 
mul(12, 3) = 36 
mul(12, 4) = 48 
mul(24, 2) = 48 
mul(24, 3) = 72 
mul(24, 4) = 96 
div(12, 2) = 6 

div(12, 3) = 4 

div(12, 4) = 3 

div(24, 2) = 12 
div(24, 3) = 8 

div(24, 4) = 6 


上 面 这 段 代 码 定义 了 三 个 向 量 ， 前 两 个 包含 着 操作 数 ， 最 后 一 个 代表 程序 员 打算 对 两 个 操作 
数 进行 的 一 系列 操作 。 最 外 层 循环 遍历 每 个 操作 运算 ， 而 最 内 层 的 两 个 循环 用 每 个 操作 数 向 
量 中 的 元 素 组 成 各 种 可 能 的 有 序数 据 对 。 最 后 ，print 语 名 打印 出 将 当前 操作 符 应 用 在 给 定 参 
数 上 所 得 的 运算 结果 。 


我 们 前 面 介 绍 过 的 模块 都 列 在 表 13.5 中 。 
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与 类 相关 的 模块 
& 明 
提供 一 个 列表 对 象 的 封装 类 
提供 一 个 字典 对 象 的 封装 类 
提供 一 个 学 符 囊 对 象 的 封 赣 类 ; 它 又 色 括 一 个 MutableStriag 子 类 ， 如 果 有 和 需要， 可 以 提供 有 关 功 能 
定义 所 有 Python 对 象 的 类 型 在 标准 Python MURIS: 
标准 的 作答 的 函数 接口 


a， 新 出 现 于 Python 1.6 版 本 


在 《Python FAQ》 中 ， 有 许多 与 类 和 面向 对 象 编程 有 关 的 问题 。 它 对 Python 类 库 以 及 
《Python 语言 参考 手册 》 都 是 很 好 的 补充 材料 。 关 于 新 风格 的 类 ， 请 参考 PEP 252、PEP 
253 和 Python2.2 以 后 的 相关 文档 。 


13.18 练习 


13-1 .程序 设计 。 请 列举 一 些 面 向 对 象 编程 与 传统 旧 的 程序 设计 形式 相 比 的 先进 之 处 。 


13-2. 函 数 和 方法 的 比较 。 函 数 和 方法 之 间 的 区 别 是 什么 ? 


13-3. 对 类 进行 定制 。 写 一 个 类 ， 用 来 将 浮 点 型 值 转换 为 金额 。 在 本 练习 里 ， 我 们 使 用 美 
国货 币 ， 但 读者 也 可 以 自选 任意 货币 。 


基本 任务 : 编写 一 个 dollarize() 函 数 ， 它 以 一 个 浮 点 型 值 作 为 输入 ， 返 回 一 个 字符 串 
形式 的 金额 数 。 比 如 说 : 


dollarize(1234567.8901) => '$1,234,567.89. 


第 13 章 面向 对 象 编程 


620 


Python 核心 编程 第 二 版 


dollarize() 返 回 的 金额 数 里 应 该 允许 有 运 号 (1849 1,000,000). 和 美元 的 货币 符号 。 
如 果 有 负 号 ， 它 必须 出 现在 美元 符号 的 左边 。 完 成 这 项 工作 后 ， 你 就 可 以 把 它 转换 
成 一 个 有 用 的 类 ， 名 为 MoneyFmt 。 


MoneyFmt 类 里 只 有 一 个 数据 值 ( 即 金额 ) ， 和 5 个 方法 〈 你 可 以 随意 编写 其 他 方 

法 ) 。 init () 构 造 器 对 数据 进行 初始 化 ，update() 方 法 把 数据 值 替换 成 一 个 新 

值 ，  nonzero () 是 布尔 型 的 ， 当 数据 值 非 替 时 返回 True， repr ()2;XYU$ A 
型 的 形式 返回 金额 ; 而 str () 方 法 采用 和 dollarize() 一 样 的 字符 格式 显示 该 值 。 

(a) 编写 update() 方 法 ， 以 实现 数据 值 的 修改 功能 。 

(b) 以 你 已 经 编写 的 dollarize() 的 代码 为 基础 ， 编 写 str _() 方 法 的 代码 。 


(c) AE nonzero () 方 法 中 的 错误 ， 这 个 错误 认为 所 有 小 于 1 的 数值 ， 例 如 ，50 
美人 邹 ($0.50) ， 返 回 假 值 (False) » 





(d) 附加 题 : 允许 用 户 通过 一 个 可 选 参 数 指定 是 把 负数 数值 显示 在 一 对 尖 括 号 里 还 
是 显示 一 个 负 号 。 默 认 参 数 是 使 用 标准 的 负 号 。 


13-4. 用 户 注 册 。 建 立 一 个 用 户 数 据 库 (包括 登录 名 、 密 码 和 上 次 登录 时 间 惟 ) 类 (参考 
练习 7-5 和 练习 9-12) ， 来 管理 一 个 系统 ， 该 系统 要 求 用 户 在 登录 后 才能 访问 某 些 资源 。 
这 个 数据 库 类 对 用 户 进行 管理 ， 并 在 实例 化 操作 时 加 载 之 前 保存 的 用 户 信 息 ， 提 供 访问 
函数 来 添加 或 更 新 数据 库 的 信息 。 在 数据 修改 后 ， 数 据 库 会 在 垃圾 回收 时 将 新 信息 保存 
到 磁盘 (参见 del () ° 


13-5. 几 何 。 创 建 一 个 由 有 序数 值 对 (x,y) 组 成 的 Point 类 ， 它 代表 某 个 点 的 X 坐 标 和 Y 坐 
标 。X 坐 标 和 Y 坐 标 在 实例 化 时 被 传递 给 构造 器 ， 如 果 没 有 给 出 它们 的 值 ， 则 默认 为 坐标 
的 原点 。 


13-6. 几 何 。 创 建 一 个 直线 /直线 段 类 。 除 主要 的 数据 属性 : 一 对 坐标 值 (参见 上 一 个 练 
I) 外 ， 它 还 具有 长 度 和 斜 线 属 性 。 你 需要 履 盖 repr_() 方 法 《如 果 需 要 的 话 ， 还 有 
St (QFE) ， 使 得 代表 那 条 直线 (或 直线 段 ) 的 字符 串 表 示 形 式 是 由 一 对 元 组 构成 


的 元 组 ， 即 ( (x1* y1) ^ (x2»y2) ) 。 总 结 : 
_repr 将 直线 的 两 个 端点 〈 始 点 和 止 点 ) 显示 成 一 对 元 组 。 
length 返回 直线 段 的 长 度 -不 要 使 用 "len”， 因 为 这 样 使 人 误解 它 是 整 型 。 
slope 返回 此 直线 段 的 斜率 〈 或 在 适当 的 时 候 返回 None ) 
例 13.11 ”金额 转换 程序 (moneyfmt.py ) 


字符 囊 格式 类 用 来 对 浮 点 型 值 进行 "打包 "， 使 这 个 数值 显示 为 带 有 正确 符号 的 金额 。 
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1 t!/usr/bin/env python 


3 class MoneyFmt (object): 


4 def init (self, value-0.0): # 构 造 器 

5 self.value = float(value) 

6 

7 def update (self, value-None): 间 允 许 修 改 

8 LII. 

9 i44 (a) complete this function 

10 TT. | 

11 

12 def repr (self): # 显 示 为 浮 点 型 
13 return 'self.value' 

14 

15 def str (self): # 格 式 化 显示 

16 val = '' 

17 

18 LII. 

19 ### (b) complete this function... do NOT 
20 848 forget about negative numbers!! 
21 LII. 

24 

23 return val 

24 

25 def — nonzero . (self): # boolean test 
26 LEE 

27 ### (c) find and fix the bug 

28 LER 

29 

30 return int(self.value) 


金额 转换 程序 (moneyfmtpy) 9$ ERARA 4e 113.1191 ° AALA RAATH 
证 明 ( 尚 不 完善 ) 的 版 本 moneyfmt.py。 如 果 我 们 引入 解释 程序 中 的 完整 类 ， 执 行 
过 程 将 和 下 面 类 似 : 
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>>> import moneyfmt 

>>> 

>>> cash = moneyfmt.MoneyFmt (123.45) 
>>> cash 

123.45 

>>> print cash " 

$123.45 

>>> 

>>> cash.update(100000.4567) 
>>> cash 

100000.4567 

>>> print cash 

$100,000.46 

>>> 

>>> cash.update (-0.3) 

>>> cash 

-0.3 

>>> print cash 
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«S . 30 

>>> repr(cash) 
im Pih 

»»» 'sash' 

es e" 

29» stricash) 
F-20,.30' 


13-7. 数 据 类 。 提 供 一 个 time 模 块 的 接口 ， 人 允许 用 户 按照 自己 给 定时 间 的 格式 ， 比 

如 : “MM/DD/YY” ` "*MM/DD/YYYY" ` *DD/MM/YY" ` *'DD/MM/YYYY" ` "Mon DD ， 
YYYY”， 或 是 标准 的 Unix 日 期 格式 、“Day Mon DD > HH:MM:SS YYYY" 来 查看 日 期 。 你 
的 类 应 该 维护 一 个 日 期 值 ， 并 用 给 定 的 时 间 创 建 一 个 实例 。 如 果 没 有 给 出 时 间 值 ， 程 序 
执行 时 会 默认 采用 当前 的 系统 时 间 。 还 包括 另外 一 些 方法 。 


update() 按 给 定时 间或 是 默认 的 当前 系统 时 间 修 改 数据 值 。 

display() 以 代表 时 间 格 式 的 字符 串 做 参数 ， 并 按照 给 定时 间 的 格式 显示 : 
'MDY' => MM/DD/YY 

'MDYY' =>  MM/DD/YYYY 

'DMY' =>  DD/MM/YY 

'DMYY' =>  DD/MM/YYYY 

'MODYY' = Mon DD, YYYY 


如 果 没有 提供 任何 时 间 格式 ， 默 认 使 用 系统 时 间或 ctime() 的 格式 。 附 加 题 : 把 这 个 
类 和 练习 6-15 结 合 起 来 。 


13-8. 堆 栈 类 。 一 个 堆栈 (Stack) 是 一 种 具有 后 进 先 出 (last-in-first-out, LIFO) 特性 的 
数据 结构 。 我 们 可 以 把 它 想象 成 一 个 餐 盘 架 。 最 先 放 上 去 的 盘子 将 是 最 后 一 个 取 下 来 

的 ， 而 最 后 一 个 放 上 去 的 盘子 是 最 先 被 取 下 来 的 。 你 的 类 中 应 该 有 push() 方 法 (向 堆栈 
中 压 入 一 个 数据 项 ) 和 pop() 方 法 (从 堆栈 中 移出 一 个 数据 项 ) 。 还 有 一 个 叫 sempty() 的 
布尔 方法 ， 如 果 堆 栈 是 空 的 ， 返 回 布尔 值 1， 否 则 返回 0 ; 一 个 名 叫 peek() 的 方法 ， 取 出 
堆栈 顶部 的 数据 项 ， 但 并 不 移 除 它 。 注 意 ， 如 果 你 使 用 一 个 列表 来 实现 堆栈 ， 那 么 pop() 
方法 从 Pythonl.5.2 版 本 起 已 经 存在 了 。 那 就 在 你 编写 的 新 类 里 ， 加 上 一 段 代码 检查 pop() 
方法 是 否 已 经 存在 。 如 果 经 检查 pop() 方 法 存在 ， 就 调用 这 个 内 建 的 方法 ; 否则 就 执行 你 
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自己 编写 的 pop() 方 法 。 你 很 可 能 要 用 到 列表 对 象 ; 如 果 用 到 它 时 ， 不 需要 担心 实现 列表 
的 功能 (例如 切片 )。 只 要 确保 你 写 的 堆栈 类 能 够 正确 实现 上 面 的 两 项 功能 就 可 以 了 。 
你 可 以 用 列表 对 象 的 子 类 或 自己 写 个 类 似 列 表 的 对 象 ， 请 参考 例 6.2。 


13-9. 队 列 类 。 一 个 队列 (queue) 是 一 种 具有 先进 先 出 (first-in-first-out, FIFO ) 特性 的 


数据 结构 。 一 个 队列 就 像 是 一 行 队伍 ， 数 据 从 前 端 被 移 除 ， 从 后 端 被 加 入 。 这 个 类 必须 
支持 下 面 几 种 方法 : 


enqueue() “在 列表 的 尾部 加 入 一 个 新 的 元 素 。 
dequeue() ”在 列表 的 头 部 取出 一 个 元 素 ， 返 回 它 并 且 把 它 从 列表 中 删除 。 
请 参见 上 面 的 练习 和 示例 6.3。 


13-10. 堆 栈 和 队列 。 编 写 一 个 类 ， 定 义 一 个 能 够 同时 具有 堆栈 (FIFO) 和 队列 (LIFO) 
操作 行为 的 数据 结构 。 这 个 类 和 Perl 语 言 中 数组 相像 。 需 要 实现 四 个 方法 : 


shift) ”返回 并 删除 列表 中 的 第 一 个 元 素 ， 类 似 于 前 面 的 dequeue() 函 数 。 
unshift) ”在 列表 的 头 部 “ 压 入 ”一 个 新 元 素 。 
push ”在 列表 的 尾部 加 上 一 个 新 元 素 ， 类 似 于 前 面 的 enqueue() 和 push() 方 法 。 
pop) ”返回 并 删除 列表 中 的 最 后 一 个 元 素 ， 与 前 面 的 pop() 方 法 完全 一 样 。 
请 参见 练习 13-8 和 练习 13-9。 

13-11. 电 子 商 务 。 


你 需要 为 一 家 B2C (企业 到 消费 者 ) 零售 商 编 写 一 个 基础 的 电子 商务 引擎 。 你 需要 
写 一 个 针对 顾客 的 类 USser， 一 个 对 应 存货 清单 的 类 ltem， 还 有 一 个 对 应 购物 车 的 类 
叫 Cart。 货 物 放 到 购物 车 里 ， 顾 客 可 以 有 多 个 购物 车 。 同 时 购物 车 里 可 以 有 多 个 货 
物 ， 包 括 多 个 同样 的 货物 。 


13-12. 聊 天 室 。 你 对 目前 的 聊天 室 程 序 感到 非常 失望 ， 并 决心 要 自己 写 一 个 ， 创 建 一 家 
新 的 因特网 公司 ， 获 得 风险 投资 ， 把 广告 集成 到 你 的 聊天 室 程序 中 ， 争 取 在 六 个 月 的 时 
间 里 让 收入 翻 五 倍 ， 股 票 上 市 ， 然 后 退休 。 但 是 ， 如 果 你 没有 一 个 非常 酷 的 聊天 软件 ， 
这 一 切 都 不 会 发 生 。 你 需要 三 个 类 : 一 个 Message 类 ， 它 包含 一 个 消息 字符 串 以 及 诸如 
广播 、 单 方 收 件 人 等 其 他 信息 ， 一 个 User 类 ， 和 包含 了 进入 你 聊天 室 的 菜 个 人 的 所 有 信 

息 。 为 了 从 风险 投资 者 那里 拿 到 启动 资金 ， 你 加 了 一 个 Room 类 ， 它 体现 了 一 个 更 加 复杂 
的 聊天 系统 ， 用 户 可 以 在 聊天 时 创建 单独 的 "房间 "， 并 邀请 其 他 人 加 入 。 附 加 题 : 请 为 用 
户 开发 一 个 图 废 & 化 用 户 界面 应 用 程序 。 


13-13. 股 票 投资 组 合 类 。 你 的 数据 库 中 记录 了 每 个 公司 的 名 字 、 股 票 代 号 、 购 买 日 期 、 
购买 价格 和 持 股 数量 。 需 要 编写 的 方法 包括 : 添加 新 代号 (新 买 的 股票 )、 删 除 代号 
(所 有 卖 出 股票 ) ， 根 据 当 前 价格 (及 日 期 ) 计算 出 的 YTD 或 年 回报 率 。 请 参见 练习 7- 
6 o 
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13-14.DOS 。 为 DOS 机 器 编写 一 个 Unix 操 作 界 面 的 shell。 你 向 用 户 提供 一 个 命令 行 ， 使 


得 用 户 可 以 在 那里 输入 Unix 命 令 ， 你 可 以 对 这 些 命令 进行 解释 ， 并 返回 相应 的 输出 ， 例 


如 : “lS” 命令 调 用 “dir" 来 显示 一 个 目录 中 的 文件 列表 ，“more” 调 用 同名 命令 (分 页 显示 一 


个 文件 ) > "cat" HAA “type” > "cp"? "copy" > “mv” A “ren” > "rm"? A “de” * E ° 


13-15. 授 权 。 示 例 13.8 的 执行 结果 表明 我 们 的 类 CapOpen 能 成 功 完 成 数据 的 写 入 操作 。 
在 我 们 的 最 后 评论 中 ， 提 到 可 以 使 用 CapOpen() 或 open() 来 读 取 文件 中 的 文本 。 为 什么 


呢 ?这 两 者 使 用 起 来 有 什么 差异 吗 ? 


13-16. 授 权 和 函数 编程 。 


(a) 请 为 示例 13.8 中 的 CapOpen 类 编写 一 个 writelinesO 方 法 。 这 个 新 函数 将 可 以 
一 次 读 入 多 行文 本 ， 然 后 将 文本 数据 转换 成 大 写 的 形式 ， 它 与 Write() 方 法 的 区 别 和 


通常 意思 上 的 writelinesO 与 write() 方 法 之 间 的 区 别 相 似 。 注 意 : 编写 完 这 个 方法 
后 ，writelinesO 〇 将 不 再 由 文件 对 象 “ 代 理 ”。 


(b) 在 writelines() 方 法 中 添加 一 个 参数 ， 用 这 个 参数 来 指明 是 否 需 要 为 每 行文 本 加 


上 一 个 换行 符 。 此 参数 的 默认 值 是 False， 表 示 不 加 换行 符 。 


13-17. 数 值 类 型 子 类 化 。 在 示例 13.3 中 所 看 到 的 moneyfmt.py 脚 本 基础 上 修改 它 ， 使 得 它 


可 以 扩展 Python 的 浮 点 类 型 。 请 确保 它 支 持 所 有 操作 ， 而 且 是 不 可 变 的 。 


13-18. 序 列 类 型 子 类 化 。 模 仿 前 面 练习 13-4 中 的 用 户 注 册 类 的 解决 方案 ， 编 写 一 个 子 
类 。 要 求 允 许 用 户 修改 密码 ， 但 密码 的 有 效 期 限 是 12 个 月 ， 过 期 后 不 能 重复 使 用 。 附 加 


题 : 支持 “相似 密码 "检测 的 功能 (任何 算法 展 可 ) ， 不 允许 用 户 使 用 与 之 前 12 个 月 期 间 所 


使 用 的 密码 相似 的 任何 密码 。 


13-19. 映 射 类 型 子 类 化 。 假 设 在 13.11.3 节 中 字典 的 子 类 ， 若 将 keys() 方 法 重 写 为 : 
def keys(self): 
return sorted(self.keys()) 


(a) 当 方 法 keys() 被 调用 ， 结 果 如 何 ? 
(b) 为 什么 会 有 这 样 的 结果 ? 如 何 使 我 们 的 原 解 决 方案 顺利 工作 ? 
13-20. 类 的 定制 。 改 进 脚 本 time60.py， 见 13.13.2 节 示例 13.3。 


(a) 人 允许" 空 " 实 例 化 : 如 果 小 时 和 分 钟 的 值 没有 给 出 ， 黑 认为 零 小 时 、 零 分 钟 。 


(b) 用 零 占 位 组 成 两 位 数 的 表示 形式 ， 因 为 当前 的 时 间 格 式 不 符合 要 求 。 如 下 面 的 


示例 ，Wed 应 该 输出 为 “12:05”。 
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>>> wed = Time60(12, 5) 
>>> wed 
l2:35 


(c) 除了 用 hours (hr) 和 minutes (min) 进行 初始 化 外 ， 还 支持 以 下 时 间 输 入 格 
二 


e 一 个 由 小 时 和 分 钟 组 成 的 元 组 (10，30) 

e 一 个 由 小 时 和 分 钟 组 成 的 字典 ({'hr':10 > 'min':30)) 

e 一 个 代表 小 时 和 分 钟 的 字符 囊 (“10:30”) 。 
附加 题 : 允许 不 恰当 的 时 间 字 符 串 表示 形式 ， 如 “12:5”。 


(d) 我 们 是 否 需 要 实现 radd () 方 法 ?为 什么 ? 如果 不必 实现 此 方法 ， 那 我 们 什 
么 时 候 可 以 或 应 该 覆盖 它 ? 


(e) ”repr_() 函 数 的 实现 是 有 缺陷 而 且 被 误导 的 。 我 们 只 是 重 载 了 此 函数 ， 这 样 
我 们 可 以 省 去 使 用 print 语 名 的 麻烦 ， 使 它 在 解释 器 中 很 好 的 显示 出 来 。 但 是 ， 这 个 
违背 了 一 个 原则 : 对 于 可 估 值 的 Python 表达 式 ，repr() 总 是 应 该 给 出 一 个 (有效 的 ) 
字符 串 表示 形式 。12:05 本 身 不 是 一 个 合法 的 Python 表达 式 ， 但 Time60 (12:05) 
是 合法 的 。 请 实现 它 。 


(D 添加 六 十 进 制 (基数 是 60) 的 运算 功能 。 下 面 示例 中 的 输出 应 该 是 19:15 ， 而 
不 是 18:75 : 


>>> thu = Time60(10, 30) 
>>> fri = Time60(8, 45) 
so "thua F oii 

18:78 


13-21. 装 饰 符 和 函数 调用 语法 。 第 13.16.4 节 末尾 ， 我 们 使 用 过 一 个 装饰 函数 符 把 X 转 化 成 
一 个 属性 对 象 ， 但 由 于 装饰 符 是 Python2.4 才 有 的 新 功能 ， 我 们 给 出 了 另 一 个 适用 于 旧版 
本 的 语法 : 
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A = DrOberty ("*"xi. 


执行 这 个 赋值 语 多 时 到 底 发 生 了 什么 呢 ?为 什么 它 和 使 用 装饰 符 语 多 是 等 价 的 ? 


[1].“sexagesimal" 是 源 自 拉丁 语 的 名 字 ; 有 时 我 们 也 说 "hexagesimal”， 这 是 一 个 硕 腊 词 
根 "hexe"” 和 拉丁 语 “gesmal” 的 混合 。 


[2]. Python2.3 中 新 增 。 


[3]. Python2.4 中 新 增 。 


第 14 章 ”执行 环境 


本 章 主 题 

e TRIES A 

e 代码 对 象 

4 afha hA 
e 执行 其 他 程序 

4 终止 执行 

4 各 类 操作 系统 接口 
e. 相关 模块 


在 Python 中 有 多 种 运行 外 部 程序 的 方法 ， 比 如 ， 运 行 操作 系统 命令 或 另外 的 Python 脚本 ， 或 
执行 一 个 磁 瘟 上 的 文件 ， 或 通过 网 络 来 运行 文件 。 这 完全 取决 于 你 想 要 干什么 。 有 些 特定 的 
执行 场景 包括 : 


e 在 当前 脚本 继续 运行 ; 


。 通过 网 络 来 调用 命令 ; 

e 执行 命令 来 创建 需要 处 理 的 输出 ; 

e. 执行 其 他 的 Python 脚本 ; 

e 执行 一 系列 动态 生成 的 Python 语 急 ; 

e 导入 Python 模块 《和 执行 它 顶 层 的 代码 ) o 


Python 中 ， 内 建 和 外 部 模块 都 可 以 提供 上 述 各 种 功能 。 程 序 员 得 根据 实现 的 需要 ， 从 这 些 模 
块 中 选择 合适 的 处 理 方法 。 本 章 将 对 Python 执行 环境 进行 全 面 的 描述， 但 不 会 涉及 如 何 启动 
Python 解释 器 和 不 同 的 命令 行 选 项 。 读 者 可 以 从 第 2 章 中 查阅 到 相关 信息 。 


QUELLI Qui dM e An cen FUE M 
Pythoni& 4] e A 3£ d Zi i$ A- Scd AU] ERAI AE o UT LAORE I) 6I UK KP R T 
Python 脚本 的 威力 ， ， c Uu. pou 定 是 不 合 逻 辑 的 ， 更 浪费 时 间 


和 人 力 。Python 给 当前 脚本 环境 提供 了 许多 执行 程序 或 者 外 部 命令 的 机 制 ， 我 们 将 介绍 最 普 
遍 的 几 个 命令 。 接 下 来 ， 我 们 对 Python 的 受 限 执行 环境 作 一 个 简短 的 概况 ， 最 后 ， 介 绍 下 各 
种 终止 执行 的 方法 (而 不 是 让 程序 正常 完成 ) 。 就 从 可 调用 对 象 开始 我 们 的 旅程 吧 。 


14.1 可 调用 对 象 


许多 的 Python 对 象 都 是 我 们 所 说 的 可 调用 的 ， 即 是 任何 能 通过 函数 操作 符 “()” 来 调用 的 对 象 。 
要 调用 可 调用 对 象 ， 函 数 操作 符 得 紧 跟 在 可 调用 对 象 之 后 。 比 方 说 ， 用 "foo()" 来 调用 函 

数 “foo”。 可 调用 对 象 可 以 通过 函数 式 编程 接口 来 进行 调用 ， 如 apply()、filter()、map() 和 
reduce()， 这 4 个 接口 我 们 都 在 11 章 讨论 过 了 。Python 有 4 种 可 调用 对 象 : 函数 、 方 法 、 类 、 
以 及 一 些 类 的 实例 。 记 住 这 些 对 象 的 任何 引用 或 者 别名 都 是 可 调用 的 。 


14.1.1 Až 


我 们 介绍 的 第 一 种 可 调用 的 对 象 是 函数 。Python 有 三 种 不 同类 型 函数 对 象 。 种 是 内 建 函 
数 。 


1. 内 建 函 数 (BIF) 


^ (Built-in Function, BIF) 是 用 C/C++ 写 的 ， 编 译 过 后 放 入 Python 解释 器 ， 然 后 把 它 
们 作为 第 一 〈 内 建 ) 名 称 空间 的 一 部 分 加 载 进 系统 。 如 前 面 章节 所 提 到 的 ， 这 些 函 数 在 
. bulitin ”模块 里 ， 并 作为 ”builtins ”模块 导入 到 解释 器 中 。 


R 14.1 内 建 函 数 属 性 








bif self | RNA None COLE ALIE 9 


f module | 存放 bif E SCRI T OR None) 





BIF 有 基础 类 型 属性 ， 其 中 一 些 独特 的 属性 已 列 在 表 14.1 中 。 
你 可 以 用 dir() 列 出 函数 的 所 有 属性 


>>> dir(type) 


EY SI To a mtaa -y C a a N eE n T7 aoe 
' getattribute ', ' hash 5 duinit ' modul La 

' name ', ' new ', ' reduce ", ' reduce.ex ", 

L TEDN U. t scHBIE !6,* Safate sí", 5 Be 3 


从 内 部 机 制 来 看 ， 因 为 BIF 和 内 建 方 法 (BM) 属于 相同 的 类 型 ， 所 以 对 BIF 或 者 BIM 调 用 
type() 的 结果 是 : 
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>>> type (dir) 


«type 'builtin function or method'» 
注意 这 不 能 应 用 于 工厂 函数 ， 因 为 type() 正 好 会 返回 产生 对 象 的 类 型 : 
>>> type (int) 
«type 'type'» 
>>> type (type) 
«type 'type'» 


2. 用 户 定义 的 函数 (UDF) 


用 户 定义 的 函数 (User-Defined Function, UDF) 通常 是 用 Python 写 的 ， 定 义 在 模块 的 最 高 
级 ， 因 此 会 作为 全 局 名 称 空间 的 一 部 分 (一 旦 创建 好 内 建 名 称 空间 ) 装载 到 系统 中 。 函 数 也 
可 在 其 他 的 函数 体内 定义 ， 并 且 由 于 在 2.2 中 嵌 套 作用 域 的 改进 ， 我 们 现在 可 以 对 多 重点 套 作 
用 域 中 的 属性 进行 访问 。 可 以 用 func_closure 属 性 来 钧 住 在 其 他 地 方 定义 的 属性 。 


如 同上 面 的 BIF，UDF 也 有 许多 的 属性 。UDF 最 让 人 感 兴趣 和 最 特殊 的 属性 都 列 在 下 面 的 表 
14.2 中 。 























X142 用 户 自 定义 函数 属性 
M ti B i$ 

wdf doc rey ETILA udffune doc) 

udí name - J 9 metr me. 《也 可 以 用 udf.func name) 
udf.func code 学 节 编 详 的 代码 对 象 

udf.func defaults 默认 的 参数 元 组 

wf func globals DARRA: RARA globalsix) - Hf 
udf.func dict 函数 属性 的 名 称 空 间 
udf,func doc (x rem wif. doc ) 


wdf func namc CHERI mdf. name ) 


| 也 含 了 自 册 变量 的 引用 的 单元 对 象 元 组 〈 自 用 变量 在 UDF 中 使 用 ， 但 在 别处 定义 : 
| 参见 《Python[ 千 吉 | 参 考 手 向 》) 





udf.func closure 


从 内 部 机 制 来 看 ， 用 户 自 定义 的 函数 是 “函数 "类 型 的 ， 如 在 下 面 的 例子 中 用 type() 表 明 的 一 
样 : 
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>>> def foo(): pass 
>>> type(foo) 
«type 'function'» 


3. lambda E 3k X, (名 为 “<lambda>” 的 函数 ) 


lambda 表 达 式 和 用 户 自 定义 对 函数 相 比 ， 略 有 不 同 。 虽 然 它 们 也 是 返回 一 个 函数 对 象 ， 但 是 
lambda 表 达 式 不 是 用 def 语 句 创建 的 ， 而 是 用 lambda 关 键 字 : 


因为 lambda 表 达 式 没有 给 命名 绑 定 的 代码 提供 基础 结构 ， 所 以 要 通过 有 函数 式 编程 接口 来 调 
用 ， 或 把 它们 的 引用 赋值 给 一 个 变量 ， 然 后 就 可 以 直接 调用 或 者 再 通过 函数 来 调用 。 变 量 仅 
是 个 别名 ， 并 不 是 函数 对 象 的 名 字 。 


通过 lambda 来 创建 函数 的 对 象 除了 没有 命名 之 外 ， 享 有 和 用 户 自 定 义 函 数 相同 的 属性 ; 
. name 或 者 funcl_name 属 性 给 定 为 字符 囊 “<lambda>”。 使 用 type() 工 厂 函 数 ， 我 们 来 演示 
下 lambda 表 达 式 返回 和 用 户 自 定义 函数 相同 的 函数 对 象 。 


>>> lambdaFunc = lambda x: x * 2 
>>> lambdaFunc (100) 

200 

>>> type(lambdaFunc) 

«type 'function'» 


在 上 面 的 例子 中 ， 我 们 将 表达 式 赋值 给 一 个 别名 。 我 们 也 可 以 直接 在 一 个 lambda 表 达 式 上 调 
用 type() : 


>>> type (lambda:1) 
«type 'function'» 


我 们 快速 的 来 看 看 UDF 名 字 ， 使 用 上 面 的 lambda Func 和 先前 小 节 中 的 foo() : 


225» foo. name 

'foo' 

>>> lambdaFunc. name 
'«lambda»' 


从 11.9 小 节 中 我 们 可 以 看 到 ， 一 旦 函数 声明 以 后 〈 且 函数 对 象 可 用 ) ， 程 序 员 也 可 以 自 定义 函 
数 属性 。 所 有 的 新 属性 变 成 udf， dict ”对象 的 一 部 分 。 在 本 章 的 稍 后 内 容 中 ， 我 们 将 讨论 获 
取 含有 Python 代 码 的 字符 串 并 执行 该 代码 。 到 了 本 章 最 后 ， 会 有 一 个 组 合 例 子 ， 着 重 描写 函 
数 属 性 和 Python 代码 〈 字 符 串 ) 的 动态 求 值 和 执行 语句 。 


14.1.2 方法 


在 第 13 章 中 ， 我 们 研究 了 方法 。 用 户 自 定义 方法 是 被 定义 为 类 的 一 部 分 画 数 。 许 多 Python 
HRS C RUSSE EAR ， 也 有 方法 ， 这 些 被 称 为 内 建 方 法 。 为 了 进一步 说 明 “ 所 有 权 ” 的 类 
型 ， 方 法 通过 对 象 的 名 字 和 句点 属性 标识 进行 命名 。 


表 14.3 内 建 方 法 属性 





1. 内 建 方法 (BIM) 


在 前 面 的 小 节 中 ， 我 们 讨论 了 内 建 方法 与 内 建 函 数 的 类 似 之 处 。 只 有 内 建 类 型 (built-in type, 
BIT) 有 内 建 方法 (built-in Method, BIM) 。 正 如 你 在 下 面 看 到 的 ， 对 于 内 建 方法 ，type() 工 
厂 函 数 给 出 了 和 BIF 相 同 的 输出 注意 ， 我 们 是 如 何 提供 一 个 内 建 对 象 来 访问 BIM: 





>>> type ([].append) 


<type 'builtin_function_or_method'> 


此 外 ，BIM 和 BIF 两 者 也 都 享有 相同 属性 。 不 同 之 处 在 于 BIM 的 ”self_ 属性 指向 一 个 Python 
对 象 ， 而 BIF 指 向 None 。 


对 于 类 和 实例 ， 都 能 以 该 对 象 为 参数 ， 通 过 内 建 函 数 dir() 来 获得 他 们 的 数据 和 方法 属性 。 这 也 
可 以 用 在 BIM 上 : 


>>> dir([].append) 








[* MI t, ' Gl» ", L ep tU, * SlEtUÉ.', 'oS6G 
' getattribute "', ' hash ', Uv init ^*', t módule .'; 

' pname ', ' new ', ' reduce. ', '. reduce ex ', 

€ EEBE. *, U*S AaWIE "ct BERETT Cu t EN I 


然而 ， 不 用 多 久 就 会 发 现 ， 从 功能 上 看 ， 用 实际 的 对 象 去 访问 其 方法 并 不 是 非常 有 用 ， 如 最 
后 的 例子 。 由 于 没有 引用 来 保存 这 个 对 象 ， 所 以 它 立 即 被 垃圾 回收 了 。 你 处 理 这 种 访问 的 类 
型 唯一 的 用 处 就 是 显示 BIT 有 什么 方法 。 


2. 用 户 定 义 的 方法 (UDM ) 


JO (User-defined method， 用 户 定义 的 方法 ) 包含 在 类 定义 之 中 ， 只 是 拥有 标准 函数 的 包 

， 仅 有 定义 它们 的 类 可 以 使 用 。 如 果 没 有 在 子 类 定义 中 被 覆盖 掉 ， 也 可 以 通过 子 类 实例 来 
2 它们 。 正 如 在 13 章 解释 的 那样 ，UDM 与 类 对 象 是 关联 的 〈 非 绑 定 方法 ) ， 
类 的 实例 来 调用 (WEZE) 。 无 论 UDM 是 否 绑 定 ， 所 有 的 UMD 都 是 相同 的 类 型 一 “实例 方 
法 ”， 如 在 下 面 例子 看 到 的 type() 调 用 : 


»»» class C(object): & 定义 类 
def foo(self): pass # 定义 UDM 
3>> © = Ct{) # 实例 化 
>>> type(C) à 类 的 类 别 
«type 'type'» 
»»» type(c) & 实例 的 类 别 
«class '. main. .C'» 
»»» type(C.foo) & 非 绑 定 方法 的 类 别 
«type 'instancemethod'» 
>>> type(c.foo) & 绑 定 方法 的 类 别 


«type 'instancemethod'» 


&11.4 TÉ f UDM&] TE o 32 Ie. IARE RBS REGE dE 1E — UE ZA REAREA 
法 。 正 如 你 从 下 面 看 到 的 ， 绑 定 的 方法 揭示 了 方法 绑 定 到 哪 一 个 实例 。 


»»» C.foo # 非 绑 定 方法 对 象 
«unbound method C.foo» 

>>> 

>>> c.foo E 绑 定 方法 对 象 

«bound method C.foo of < main, .C object at 0x00B42DD0» 
>>> c # foo (0 实例 被 绑 定 到 ..… 


« main .C object at 0x00B42DD0> 
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14.1.3 X 


我 们 可 以 利用 类 的 可 调用 性 来 创建 实例 。“ 调 用 ”类 的 结果 便 是 创建 了 实例 ， 即 大 家 所 知道 的 实 
例 化 。 类 有 默认 构造 器 ， 该 函数 什么 都 不 做 ， 基 本 上 只 有 一 个 pass 语 句 。 程 序 员 可 以 通过 实 
X. int () 方 法 ， 来 自 定义 实例 化 过 程 。 实 例 化 调用 的 任何 参数 都 会 传 入 到 构造 器 里 。 


>>> class C(object): 
def — init, (self, *args): 


print 'Instantiated with these arquments:Mn', args 


»»» Cl = C() # invoking class to instantiate cl 
Instantiated with these arguments: 

0 

>>> c2 = C('The number of the counting shall be', 3) 
Instantiated with these arguments: 


('The number of the counting shall be', 3) 
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是 如 何 让 实例 能 够 被 调用 。 


14.1.4 类 的 实例 


Python 给 类 提供 了 名 为 ”call 的 特别 方法 ， 该 方法 允许 程序 员 创 建 可 调用 的 对 象 (实例 ) 。 
默认 情况 下 ， cal () 方 法 是 没有 实现 的 ， 这 意味 着 大 多 数 实 例 都 是 不 可 调用 的 。 然 而 ， 如 
果 在 类 定义 中 履 盖 了 这 个 方法 ， 那 么 这 个 类 的 实例 就 成 为 可 调用 的 了 。 调 用 这 样 的 实例 对 象 
等 同 于 调用 _call_() 方 法 。 自 然 地 ， 任 何在 实例 调用 中 给 出 的 参数 都 会 被 传 入 到 __call_() 
中 。 那 么 foo() 就 和 foo. call (foo) 的 效果 相同 ， 这 里 foo 也 作为 参数 出 现 ， 因 为 是 对 自己 
的 引用 ， 实 例 将 自动 成 为 每 次 方法 调用 的 第 一 个 参数 。 如 果 cal () 有 参数 ， 比 如 (self, 
arg) ， 那 么 foo (arg) 就 和 调用 foo. call (foo > arg) 一 样 。 这 里 我 们 给 出 一 个 可 调用 实 
例 的 例子 ， 和 前 面 小 节 的 例子 相似 : 


>>> class C(object): 
def _ call (self, *args): 


print "I'm callable! Called with args:Mn", args 


>>> c -C() # 实例 化 

>>> c # 我 们 的 实例 

« main .C instance at 0x00B42DD0» 

»»» callable(c) # 实 例 是 可 调用 的 
True 

>>> c() # 调用 实例 

I'm callable! Called with arguments: 

() 

»»» c(3) + 呼叫 的 时 候 给 出 一 个 参数 
I'm callable! Called with arguments: 

(3,) 

>>> c(3, 'no more, no less') s 呼叫 的 时 候 给 出 两 个 参数 
I'm callable! Called with arguments: 

(3, 'no more, no less") 


记 住 只 有 定义 类 的 时 候 实 现 了 cal 方法， 类 的 实例 才能 成 为 可 调用 的 。 


14.2 ”代码 对 象 


可 调用 的 对 象 是 Python 执行 环境 里 最 重要 的 部 分 ， 然 而 他 们 只 是 冰山 一 角 。Python 语 句 、 赋 
值 、 表 达 式 ， 甚 至 还 有 模块 构成 了 更 宏大 的 场面 。 这 些 可 执行 对 象 无 法 像 可 调用 物 那样 被 调 
用 。 更 确切 地 说 ， 这 些 对 象 只 是 构成 可 执行 代码 块 的 拼图 的 很 小 一 部 分 ， 而 这 些 代码 块 被 称 
为 代码 对 象 。 


每 个 可 调用 物 的 核心 都 是 代码 对 象 ， 由 语句 、 赋 值 、 表 达 式 和 其 他 可 调用 物 组 成 。 查 看 一 个 
模块 意味 着 观察 一 个 较 大 的 、 包 含 了 模块 中 所 有 代码 的 对 象 。 然 后 代码 可 以 分 成 语句 、 赋 
值 、 表 达 式 ， 以 及 可 调用 物 。 可 调用 物 又 可 以 递归 分 解 和 到 下 一 层 ， 那 几 有 自己 的 代码 对 象 。 


一 般 说 来 ， 代 码 对 象 可 以 作为 函数 或 者 方法 调用 的 一 部 分 来 执行 ， 也 可 用 eXec 语 句 或 内 建 函 
数 eval() 来 执行 。 从 整体 上 看 ， 一 个 Python 模 块 的 代码 对 象 是 构成 该 模块 的 全 部 代码 。 

如 果 要 执行 Python 代码 ， 那 么 该 代码 必须 先 要 转换 成 字 节 编译 的 代码 〈 又 称 字 节 码 ) 。 这 才 
是 丫 正 的 代码 对 象 。 然 而 ， 它 们 不 包含 任何 关于 它们 执行 环境 的 信息 ， 这 便 是 可 调用 物 存 在 
的 原因 ， 它 被 用 来 包装 一 个 代码 对 象 并 提供 额外 的 信息 。 


还 记得 前 面 的 小 节 中 UDF 的 udf.func_code 属 性 吗 ? 呢 ， 想 不 到 吧 ? 那 就 是 代码 对 象 。UDM 的 
udm.im_func 函 数 对 象 又 是 怎么 一 回 事 呢 ? 因为 那 也 是 一 个 函数 对 象 ， 所 以 他 同样 有 它 自 己 的 
udm.im_func.func_code 代 码 对 象 。 这 样 的 话 ， 你 会 发 现 ， 函 数 对 象 仅 是 代码 对 象 的 包装 ， 方 
法 则 是 给 函数 对 象 的 包装 。 你 可 以 到 处 看 看 。 当 研究 到 最 底层 ， 你 会 发 现 便 是 一 个 代码 对 

象 。 


14.3 ”可 执行 的 对 象 声 明 和 内 建 函 数 


Python 提供 了 大 量 的 BIF 来 支持 可 调用 /可 执行 对 象 ， 其 中 包括 exec 语 句 。 这 些 函 数 帮助 程序 
员 执 行 代 码 对 象 ， 也 可 以 用 内 建 函 数 complie() 来 生成 代码 对 象 。 





表 14.5 可 热 行 的 对 象 声 明和 内 建 函 数 
内 建 函数 和 语句 mi i 
callable(obj) -—— 和 如果 obj eT RH. BE True, SWEN FALSE 
compile(string file, type) | M, type ZH OEICPIHE. file 是 代码 存 克 的 地 方 〈 通 常设 为 ”) 





对 obj SHTRIN obj 是 已 编 洋 为 代码 对 象 的 表达 式 ， 或 是 一 个 字符 店家 达 式 ， 可 以 给 


n bj, global: obals(), locals locals()) ^ 1 " Je s^ 
eval(obj, globale globals(), locals locals) 1H 4e Kl e E/O NO A866) e e c f] 


HUF obj. MM Python WERA., CEREREA? 











exec obj + - AIT EAM t 
"s QW. obj 也 可 以 是 一 个 文件 对 象 《已 经 打开 的 有 效 Python WAP) 
input(proetpr-") 等 同 于 eval (raw. input(prompt-")) 


14.3.1 callable() 


callable() 是 一 个 布尔 函数 ， 确 定 一 个 对 象 是 否 可 以 通过 函数 操作 符 (()) 来 调用 。 如 果 函 数 可 
调用 便 返 回 True， 和 否则 便 是 False (对 与 2.2 和 较 早 的 版 本 而 言 ， 分 别 是 1 和 0) 。 这 里 有 些 对 
象 及 其 对 应 的 callable 返 回 值 : 


>>> callable (dir) # 内 建 函数 
True 

»»» callable(1) # 整 型 
False 


>>> def foo(): pass 


»»» callable(foo) # 用 户 自 定义 函数 
True 

>>> callable('bar') # 字符 串 

False 


>>> class C(object): pass 


>>> callable (C) # 类 


True 


14.3.2 compile() 


compile() 函 数 允 许 程序 员 在 运行 时 刻 迅 速生 成 代码 对 象 ， 然 后 就 可 以 用 exec 语 印 或 者 内 建 函 
数 eval() 来 执行 这 些 对 象 或 者 对 它们 进行 求 值 。 一 个 很 重要 的 观点 是 : exec 和 eval() 都 可 以 执 
行 字符 串 格式 的 Python 代码 。 当 执行 字符 串 形式 的 代码 时 ， 每 次 都 必须 对 这 些 代码 进行 字 节 
编译 处 理 。compile() 函 数 提供 了 一 次 性 字 节 代码 预 编译 ， 以 后 每 次 调用 的 时 候 ， 都 不 用 编译 
2 

compile 的 三 个 参数 都 是 必需 的 ， 第 一 参数 代表 了 要 编译 的 Python 代码 。 第 二 个 字符 串 ， 虽 然 
是 必需 的 ， 但 通常 被 置 为 宅 串 。 该 参数 代表 了 存放 代码 对 象 的 文件 的 名 字 (字符 串 类 型 ) 。 
compile 的 通常 用 法 是 动态 生成 字符 串 形式 的 Python 代 码 ， 然 后 生成 一 个 代码 对 象 一 一 代码 显 
然 没 有 存放 在 任何 文件 。 


最 后 的 参数 是 个 字符 串 ， 它 用 来 表明 代码 对 象 的 类 型 。 有 三 个 可 能 值 : 


'eval' 可 求 值 的 表达 式 [ 和 eval () 一 起 使 用 ] 
'single' 单一 可 执行 语句 [和 exec 一 起 使 用 ] 
'exec' 可 执行 语句 组 [和 exec 一 起 使 用 ] 


1. 可 求 值 表达 式 


>>> eval code = compile('100 + 200', '', 'eval') 
>>> eval(eval code) 


300 


2. 单一 可 执行 语句 


>>> single code = compile('print "Hello world!"', '', 'single') 
»»» single code 

«code object ? at 120998, file "", line 0» 

»»» exec single code 


Hello world! 
3. 可 执行 语句 组 


>>> exec code = compile(""" 
req = input('Count how many numbers? ') 
for eachNum in range (req): 
print eachNum 
TO 
>>> exec exec code 


Count how many numbers? 6 
0 
1 
2 
3 
4 


5 


在 最 后 的 例子 中 ， 我 们 第 一 次 看 到 input()。 一 直 以 来 ， 我 们 都 是 从 raw_input() 中 读 取 输入 的 。 
内 建 函 数 input() 是 我 们 将 在 本 章 稍 后 讨论 的 一 个 快捷 函数 。 


14.3.3 eval() 


eval() 对 表达 式 求 值 ， 后 者 可 以 为 字符 串 或 内 建 函 数 complie() 创 建 的 预 编译 代码 对 象 。 这 是 
eval() 第 一 个 也 是 最 重要 的 参数 ..…….. 这 便 是 你 想 要 执行 的 对 象 。 第 二 个 和 第 三 个 参数 ， 都 为 可 
选 的 ， 分 别 代表 了 全 局 和 局 部 名 称 空 间 中 的 对 象 。 如 果 给 出 这 两 个 参数 ，globals 必 须 是 个 字 
典 ，|ocals 可 以 是 任意 的 映射 对 象 ， 比 如 ， 一 个 实现 了 getitem() 方 法 的 对 象 。 (在 2.4 之 前 ， 
local 必 须 是 一 个 字典 ) 如 果 都 没 给 出 这 两 个 参数 ， 分 别 默认 为 globals() 和 |ocals() 返 回 的 对 
象 ， 如 果 只 传 入 了 一 个 全 局 字典 ， 那 么 该 字典 也 作为 locals 传 入 。 好 了 ， 我 们 一 起 来 看 看 
eval(): 


»»».eval('932') 
932 
> 1nEI'932') 
934 


在 这 种 情况 下 ，eval() 和 int() 都 返回 相同 的 结果 : 整 型 932。 然 而 ， 它 们 采用 的 方式 却 不 尽 相 
同 。 内 建 函 数 eval() 接 收 引号 内 的 字符 串 并 把 它 作为 Python 表达 式 进 行 来 值 。 内 建 函 数 int() 接 
收 代表 整 型 的 字符 串 并 把 它 转换 为 整 型 。 这 只 有 在 该 字符 串 只 由 字符 串 932 组 成 的 时 候 才 会 成 


功 ， 而 该 字符 串 作 为 表达 式 返 回 值 932，932 也 是 字符 串 ”932” 所 代表 的 整 型 。 当 我 们 用 纯 字符 
串 表 达 式 的 时 候 ， 两 者 便 不 再 相同 了 : 


>>> eval('100 + 200") 

300 

>>> int('100 + 200") 

Traceback (innermost last): 

File "«stdin»", line I, in ? 

ValueError: invalid literal for int(): 100 + 200 
在 这 种 情况 下 ，eval() 接 收 一 个 字符 串 并 把 *100+200" 作 为 表达 式 求 值 ， 当 进行 整 型 加 法 后 ， 
给 出 返回 值 300。 而 对 int() 的 调用 失败 了 ， 因 为 字符 串 参 数 不 是 能 代表 整 型 的 字符 串 ， 因 为 在 
字符 串 中 有 非法 的 文字 ， 即 ， 空 格 以 及 "+" 字 符 。 可 以 这 样 理解 eval() 函 数 的 工作 方式 : 对 表达 
式 两 端的 引号 视而不见 ， 接 着 假设 “如 果 我 是 Python 解释 器 ， 我 会 怎样 去 观察 表达 式 呢 ?2”"， 换 
名 话说 ， 如 果 以 交互 方式 输入 相同 的 表达 式 ， 解 释 器 会 做 出 怎么 样 的 反应 呢 ? 按 下 回 车 后 的 
结果 应 该 和 eval() 返 回 的 结果 相同 。 


14.3.4 exec 


和 eval() 相 似 ，exec 语 名 执行 代码 对 象 或 字符 串 形式 的 Python 代码 。 类 似 地 ， 用 compile() 预 编 


译 重 复 代 码 有 助 于 改善 性 能 ， 因 为 在 调用 时 不 必 经 过 字 节 编译 处 理 。exec 语 名 只 接受 一 个 参 
数 ， 下 面 便 是 它 的 通用 语法 : 


exec obj 
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被 执行 的 对 象 (obj) 可 以 只 是 原始 的 字符 囊 ， 比 如 单一 语句 或 是 语句 组 ， 它 们 也 可 以 预 编译 
成 一 个 代码 对 象 (分 别 用 “single” 和 “exec"” 参 数 ) 。 下 面 的 例子 中 ， 多 个 语句 作为 一 个 字符 串 


发 送 给 exec : 


>>> exec "not 


x 1s currently: 


x-0 


print 'x is currently.', x 


while x « 5: 


x t2 1 


print 'incrementing x to:', x 


incrementing x 


incrementing 


incrementing 


x 
incrementing x 
x 
X 


incrementing 


0 


cto: 


CO 


1 
2 
3 
4 
5 


最 后 ，exec 还 可 以 接受 有 效 的 Python 文件 对 象 。 如 果 我 们 用 上 面 的 多 行 代码 创建 一 个 叫 
Xxcount.py 的 文件 ， 那 么 也 可 以 用 下 面 的 方法 执行 相同 的 代码 : 


»»» f 


open('xcount.py') 


>>> exec f 


x is currently: 0 


incrementing x to: 
incrementing x to: 
incrementing 
incrementing 


incrementing 


* x x 
ct 
o 
a NS rPe 


et 
o 
.. ES 
Cn 


»»» exec f 


>>> 


Z% E> 
$143: 


执行 环境 


+ 打开 文件 
# 执行 文件 


# 尝试 再 一 次 执行 
# 哦 ， 失 败 了 . . .为 什么 ? 
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注意 一 旦 执行 完毕 ， 继 续 对 exec 的 调用 就 会 失败 。 呢 ， 并 不 是 真正 的 失败 .……. 只 是 不 再 做 任 
何事 ， 这 或 许 让 你 感到 吃惊 。 事 实 上 ，exec 已 从 文件 中 读 取 了 全 部 的 数据 且 停 留 在 文件 末尾 
(end-of-file, EOF) 。 当 用 相同 文件 对 象 对 exec 进 行 调用 的 时 候 ， 便 没有 可 以 执行 的 代码 

了 ， 所 以 exec 什 么 都 不 做 ， 如 同上 面 看 见 的 行为 。 我 们 如 何 知道 它 在 EOF 呢 ? 


我 们 用 文件 对 象 的 tell() 方 法 来 告诉 我 们 处 于 文件 的 何 处 ， 然 后 用 os.path.getsize() 来 告诉 我 们 
xcount.py 脚 本 有 多 大 。 这 样 你 就 会 发 现 ， 两 个 数字 完全 一 样 : 


>>> f.tell() # 我 们 在 文件 的 什么 地 方 ? 
116 
22» f.close() # 关闭 文件 


>>> from os.path import getsize 


>>> getsize('xcount.py') # 文件 有 多 大 ? 

116 
如 果 想 在 不 关闭 和 重新 打开 文件 的 情况 下 再 ， 可 以 用 seek() 到 文件 最 开头 并 再 次 调用 
exXec 了 。 比 如 ， 假 定 我 们 还 没有 调用 f.close()， Lp 文 样 做 : 

>>> f.seek(0) # 倒 回 文件 开头 


>>> exec f 

Xx is currently: O0 
incrementing x to: 1 
incrementing x to: 2 
incrementing x to: 3 
incrementing x to: 4 
incrementing x to: 5 


>>> f.close() 


14.3.5 input() 


内 建 函 数 input() 是 eval() 和 raw_input() 的 组 合 ， 等 价 于 eval (raw. input). 。 类 似 于 
raw_input()，input() 有 一 个 可 选 的 参数 ， 该 参数 代表 了 给 用 户 的 字符 串 提 示 。 如 果 不 给 定 参 数 
的 话 ， 该 字符 串 默 认为 空 串 。 


从 功能 上 看 ，input 不 同 于 raw_input()， 因 为 raw_input() 总 是 以 字符 串 的 形式 ， 逐 字 地 返回 用 
户 的 输入 。input() 履 行 相 同 的 的 任务 ; 而 且 ， 它 还 把 输入 作为 Python 表达 式 进行 求 值 。 这 意 


味 着 input() 返 回 的 数据 是 对 输入 表达 式 求 值 的 结果 : 一 个 Python 对 象 。 


下 面 的 例子 会 让 人 更 加 清楚 : 当 用 户 输入 一 个 列表 时 ，raw_ input() 返 回 一 个 列表 的 字符 串 描 
绘 ， 而 input() 返 回 实际 的 列表 : 


>>> aString = raw input('Enter a list: ') 
Enter a List: [ 123, 'xyz', 42.97 ] 

>>> aString 

"I 229. UAVE', 435.607 Jj" 

>>> type(aString) 

«type 'str'» 


a LL 。 正 如 你 看 见 的 ， 每 样 东西 都 是 字符 串 。 现 在 来 看 看 当 用 input() 的 时 候 
会 发 生 什么 


>>> aList = input('Enter a list: ') 
Enter & list: [ 123, 'zyz', 45.857 ] 
>>> aList 

LlZ3, "xyz', 425.67] 

>>> type (aList) 

«type 'list'» 


虽然 用 户 输 入 字符 串 ， 但 是 input() 把 输入 作为 Python 对 象 来 求 值 并 返回 表达 式 的 结 


14.3.6 ”使 用 Python 在 运行 时 生成 和 执行 Python 代码 


本 小 节 我 们 将 看 到 两 个 Python 脚本 的 例子 ， 这 两 个 例子 在 运行 时 刻 把 Python 代码 作为 字符 串 
并 执行 。 第 一 个 例子 更 加 动态 ， 但 第 二 个 突出 了 函数 属性 。 


1.， 在 运行 时 生成 和 执行 Python 代码 


第 一 个 例子 是 loopmake.py 脚 本 ， 一 个 简单 的 、 迅 速生 成 的 和 执行 循环 的 计算 机 辅助 软件 工程 
(computer-aided software engineering > CASE) 。 它 提示 用 户 给 出 各 种 参数 (上 比如， 循环 
类 型 (while 或 for) ， 和 迭代 的 数据 类 型 (数字 或 序列 ) ) ， 生 成 代码 字 串 ， 并 执行 它 。 


例 14.1 动态 生成 和 执行 Python 代码 (loopmake.py ) 
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1 d!/usr/bin/env Python 

2 

3 dashes = '\n' + '-* * 50 4 egt imr dr 

4 exec dict = ( 

5 

B  *'ph ad for 循环 

7 for $s in 5s: 

8 print ès 

Q n", 

10 

j]i talp "** t while 循环 序列 
12 $s=0 

13 $s = $s 

14 while $5 < len(ss): 

15 print $s[is] 

16 s = 1s * 1 

17 "ne, 

18 

+ "atr YAS 8 LEE while 循环 
20 s= *d 

21 while s < td: 

22 print $5 

23 $s = às + d 

ZA NNNM 

45 1 

26 

27 def main(): 

28 

29 ltype*raw input( 'Loop type?(For/While) ') 
30 dtype* raw input('DOata type?(Number/seq) ') 
31 

32 if dtype == 'n': 

33 start = input('Startíng value? ') 
34 stop= input('Ending value (non-inclusive)? ') 
35 step=input('Stepping value? ') 

36 seq™ str(range(start, stop, step)) 
37 

38 elso: 

39 seq raw input('Enter sequence: ') 

40 

ål var = raw input('Iterative variable name? ') 
42 

43 if ltype == 'f': 
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44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 


exec str = exec dict['f'] $ (var, seg, var) 


elif ltype == 'w': 
if dtype == 's': 


svar = raw input('Enter sequence name? ') 


exec str = exec dict['s')] & \ 


(var, svar, seg, var, svar, svar, var, var, var) 


elif dtype == 'n': 
exec str = exec dict['n'] $ \ 
(var, start, var, stop, var, var, var, step) 


print dashes 

print 'Your custom-generated code:' + dashes 
print exec str + dashes 

print 'Test execution of the code:' + dashes 
exec exec str 

print dashes 


if name --2' main ': 


main () 


以 下 是 一 些 脚本 执行 的 例子 。 
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$ loopmake.py 
Loop type? (For/While) f 
Data type? (Number/Sequence) n 
Starting value? 0 
Ending value (non-inclusive)? 4 
Stepping value? 1 


Iterative variable name? counter 


— — — a — — — — — i— a i e i s s m m m m m m m m m c i — i  — i A 


for counter in [O, 1, 2, 3]: 


print counter 


—— — — — — — — — — Á— — —— — — — — — — — Á— — — — Á—— — —— ee — — i i i i m m c nn 


$ loopmake.py 

Loop type? (For/While) w 

Data type? (Number/Sequence) n 
Starting value? 0 

Ending value (non-inclusive)? 4 


Stepping value? 1 
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Iterative variable name? counter 


Your custoa-generated code: 


counter = 0 
while counter < 4: 
print counter 
counter = counter + 1 
Test execution of the code: 
0 
1 
2 
3 
* loopmake.py 
Loop type? (For/While) £ 
Data type? (Number/Sequence) s 
Enter sequence: [932, 'grail', 3.0, 'arrrghhn'] 
Iterative variable name? eachItem 


Your custom-generated code: 


for eachItem ín [932, 'grail', 3.0, 'arrrghhh']: 
print eachItem 


Test execution of the code: 


^ loopmake.py 

Loop type? (For/While) w 

Data type? (Number/Sequence) s 

Enter sequence: [932, 'grail', 3.0, 'arrrghhh'] 
Iterative variable name? eachIndex 

Enter sequence name? myList 


eachindex = 0 
myList = [932, 'graíl', 3.0, 'arrrghhh'] 
while eachIndex < len(myList]: 

print myList[eachIndex] 

eachIndex * eachIndex * 1 


Test execution of the code: 


932 
grail 
3.0 
arrrghhh 


2- 逐 行 解释 
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1- 25 行 


在 脚本 的 第 一 部 分 ， 我 们 设置 了 两 个 全 局 变量 。 第 一 个 是 由 一 行 破 折 号 ( 即 是 名 字 ) 组 成 的 
静态 字符 串 ， 第 二 个 则 是 由 用 于 生成 循环 的 骨架 代码 组 成 的 字典 。for 循 环 的 健 值 是 站， 用 于 
和 迭代 序列 的 while 循 环 的 则 是 “s”, 而 记 数 while 循 环 的 是 “n”。 


27 ~ 30 行 
这 里 我 们 提示 用 户 输入 他 想 要 的 循环 类 型 和 数据 类 型 。 
32 ~ 36 行 


选 定数 字 ; 给 出 开始 、 停 止 和 增 量 值 。 在 这 个 部 分 的 代码 中 ， 第 一 次 引入 了 内 建 函 数 input() 。 
我 们 将 在 14.3.5 小 节 中 看 到 ，input() 和 raw_input() 相 似 ， 因 为 它 提示 用 户 给 出 字符 串 输入 ， 但 
是 不 同 于 raw_input(), input() 会 把 输入 当成 Python 表达 式 来 求 值 ， 即 使 用 户 以 字符 串 的 形式 输 
入 ， 也 会 返回 一 个 Python 对 象 。 


38 ~ 3947 

选 定 序列 ; 这 里 以 字符 串 的 形式 输入 一 个 序列 。 
41 行 

给 出 用 户 想 要 使 用 的 迭代 循环 变量 的 名 字 。 
43 ~ 44 行 

生成 添加 自 定义 内 容 的 for 循 环 。 

46 ~ 5041 

生成 迭代 序列 的 while 循 环 。 

52 ~ 54 行 

生成 计数 的 while 循 环 。 

56 ~ 61 行 

输出 生成 的 源 代码 及 其 执行 后 的 结果 。 

63 ~ 64 行 

当 直 接 调用 该 模块 的 时 候 ， 执 行 main()。 


为 了 很 好 地 控制 脚本 的 大 小 ， 我 们 从 原来 的 脚本 中 别 除 了 所 有 的 注释 和 错误 检测 。 在 本 书 的 
Web 站 点 上 ， 都 可 以 找到 原来 的 和 修改 后 的 版 本 。 


扩展 的 版 本 包括 了 额外 的 特性 ， 比 如 用 于 字符 串 输入 的 不 必要 的 引号 ， 输 入 数据 的 默认 值 ， 
以 及 检测 无 效 的 返回 和 标识 符 ; 也 不 允许 以 关键 字 和 内 建 名 字 作为 变量 名 字 。 


3- 有 条 件 地 执行 代码 


第 二 个 例子 着 重 描写 了 在 第 11 章 引入 的 函数 属性 ， 它 是 从 Python 增强 提议 232 (PEP 232) 
中 的 例子 得 到 的 灵感 。 假 设 你 是 一 位 负责 质量 控制 的 软件 开发 者 ， 你 鼓励 你 的 工程 师 将 回归 
测试 或 回归 指令 代码 放 到 主 代码 中 ， 但 又 不 想 让 测试 代码 混合 到 产品 代码 中 。 你 可 以 让 工程 
师 创 建 字符 串 形式 的 测试 代码 。 当 你 的 测试 框架 执行 的 时 候 ， 它 会 检测 函数 是 否定 义 了 测试 
体 ， 如 果 是 的 话 ，( 求 值 并 ) 执行 它 。 如 果 不 是 ， 便 跳 过 ， 像 通常 一 样 执行 。 


例 14.2 函数 属性 (funcAttrs.py) 


调用 Sys.exit() 使 Python 解释 器 退出 。exit() 的 任何 整 弄 


值 默认 为 0。 
1 $!/usr/bin/env python 


def foo): 


6 def bar): 


7 'bar() does not do much' 

8 return True 

9 

10 foo do« = 'foo() does nc 

1 foo.testerz''' 

12 i£ fco() 

13 print 'PASSEL 

1 else 

15 print 'FAILED' 

16 Ve 

17 

18 for eachAttr in dir(): 

19 obi = eval(eachAttr) 

20 if isinstance(obj, type(fo 
21 if hasattr(obj, '. doc 
22 print 'MnFunction 


String: \n\tss" 


23 if hasattr(obj, 'tester'): 

24 print 'Function "$s" 
ing' * eachAttr 

25 exec obj.tester 

26 else: 

27 print 'Function "$s" ha 
ping’ $ eachAttr 

28 else: 

29 print '"$s" is not a function' 


0)): 


参数 作为 退出 状态 会 返回 给 调用 者 ， 该 


(eachAttr, obj. doc 


y no tester... skip 


è eachAttr 


我 们 在 脚本 的 开始 部 分 定义 了 foo() 和 bar()。 两 个 函数 都 只 是 返回 True。 不 同 点 在 于 foo() 没 有 
属性 而 bar() 有 文档 字 串 。 


10 ~ 16 行 


使 用 函数 属性 ， 我 们 给 foo() 加 入 了 文档 字 串 以 及 退化 或 单元 测试 字符 串 。 注 意 检测 字符 串 实 
际 上 由 Python 代码 组 成 。 


18 ~ 29 行 
好 了 ， 昌 正 的 工作 在 这 里 开始 。 我 们 从 用 内 建 函 数 dir() 和 迭代 现在 〈 即 全 局 ) 名 称 空间 开始 。 它 


返回 的 列表 包含 了 所 有 对 象 的 名 字 。 因 为 这 些 都 是 字符 串 ， 我 们 需要 在 第 19 行 将 它们 转化 为 
i 3E 8] Python at & » 


除了 预期 的 系统 变量 ， 比 如 ，_builtins _， 我 们 还 期 望 显示 函数 。 我 们 只 对 函数 有 兴趣 ; 第 
20 行 的 代码 让 我 们 跳 过 了 所 有 遇 到 的 非 函数 对 象 。 一 旦 我 们 知道 我 们 有 某 个 函数 ， 就 可 以 检 
查 它 是 否 有 文档 字 串 ， 如 果 有 的 话 ， 把 它 显示 出 来 。23~27 行 表演 了 魔法 。 如 果 函 数 有 检测 属 
性 ， 那 么 就 执行 它 ， 否 则 告诉 用 户 没 有 可 用 的 单元 测试 。 最 后 的 几 行 显示 出 遇 到 的 非 函数 对 
象 的 名 字 。 执 行 代码 后 ， 我 们 得 到 如 下 的 输出 : 


$ python funcAttr.py 
= Bbulltins. " 3s Bot à function 
"oe " zs not 4 function 
S Eile " is not & function 
" name " is not a function 
Function "bar" has a doc string: 
bar() does not do much 
Function "bar" has no tester... skipping 
Function "foo" has a doc string: 
foo() does not do much 
Function "foo" has a tester... executing 


PASSED 


14.4 执行 其 他 (Python) 程序 


当 讨 论 执 行 其 他 程序 时 ， 我 们 把 它们 分 类 为 Python 程序 和 其 他 所 有 的 非 Python 程 序 ， 后 者 包 
括 了 二 进 制 可 执行 文件 或 其 他 脚本 语言 的 源 代 码 。 我 们 先 讨论 如 何 运 行 其 他 的 Python 程序 ， 
然后 是 如 何 用 os 模块 调用 外 部 程序 。 


14.4.1 X^ 


在 运行 时 刻 ， 有 很 多 执行 另外 Python 脚本 的 方法 。 正 如 我 们 先前 讨论 的 ， 第 一 次 导入 模块 会 
执行 模块 最 高 级 的 代码 。 不 管 你 是 否 需要 ， 这 就 是 Python 寻 入 的 行为 。 提 醒 ， 只 有 属于 模块 
最 高 级 的 代码 才 是 全 局 变量 、 全 局 类 和 全 局 函数 声明 。 


核心 笔记 : 当 模 块 导 入 后 ， 就 执行 所 有 的 模块 


这 只 是 一 个 善意 的 提醒 : 在 先前 的 第 3 章 和 第 12 章 已 经 谈 过 了 ， 现 在 再 说 一 次 ， 当 导入 Python 
模块 后 ， 就 会 执行 所 有 的 模块 | 当 你 导入 foo 模 块 时 候 ， 它 运行 所 有 最 高 级 别 的 ( 即 没有 缩 进 
的 ) Python 人 代码， 比如 ，“main()”。 如 果 foo 含 有 bar 元 数 的 声明 ， 那 么 便 执 行 def foo (...) ° 
再 问 一 次 为 什么 会 这 样 做 呢 ? 由 于 茶 些 原因 ，bar 必 须 被 识别 为 foo 模 块 中 一 个 有 效 的 名 字 ， 也 
就 是 说 bar 在 foo 的 名 称 空间 中 。 其 次 ， 解 释 器 要 知道 它 是 一 个 已 声明 的 函数 ， 就 像 本 地 模块 中 
的 任何 一 个 函数 。 现 在 我 们 知道 要 做 什么 了 ， 那 么 如 何 处 理 那些 不 想 每 次 导入 都 执行 的 代码 
呢 ? 缩 进 它 ， 并 放 入 if name  --2' main “的 内 部 。 


跟着 应 该 是 一 个 if 语 句 ， 它 通过 检测 name 来 确定 是 否 要 调用 脚本 ， 比 如 ，“if name _ == 
' main ”。 如 果 相 等 的 话 ， 你 的 脚本 会 执行 main 内 代码 ; 否则 只 是 打算 导入 这 个 脚本 ， 那 
么 可 以 在 这 个 模块 内 对 代码 进行 测试 。 


当 导 入 Python 模 块 后 ， 会 执行 该 模块 | 当 你 导入 foo 模 块 时 候 ， 它 运行 所 有 最 高 级 别 的 ( 即 没 
有 缩 进 的 ) Python 代码 ， 再 问 一 次 为 什么 会 这 样 做 呢 ? 由 于 某 些 原因 ，bar 必 须 被 识别 为 foo 
模块 中 一 个 有 效 的 名 字 ， 也 就 是 说 bar 在 foo 的 名 称 空间 中 ， 其 次 ， 解 释 器 要 知道 它 是 一 个 已 声 
明 的 函数 ， 就 像 本 地 模块 中 的 任何 一 个 函数 。 现 在 我 们 知道 要 做 什么 了 ， 那 么 如 何 处 理 那些 
不 想 每 次 导入 都 执行 的 代码 呢 ? 缩 进 它 ， 并 放 入 if name -2' main “的 内 部 。 

# importl.py 

print 'loaded import1l' 

import import2 


这 里 是 import2.py 的 内 容 : 


t import2.py 
print 'loaded import2' 


这 是 当 我 们 导入 import1 时 的 输出 : 


>>> import importl 
loaded importl 


loaded import2 
b. 


根据 建议 检测 name 值 的 迁 回 工作 法 ， 我 们 改变 了 importl.py 和 import2.py 里 的 代码 ， 这 样 的 情 
况 就 不 会 发 生 了 。 
这 里 是 修改 后 的 import.py 版 本 : 

# importl.py 

import import2 

if | name 3-- ' main ': 


print 'loaded importl' 
接着 是 import2.py 的 代码 ， 以 相同 的 方式 修改 : 
# import2.py 
if _name == ' main ' 
print 'loaded import2' 


当 从 Python 中 导入 import1 的 时 候 ， 我 们 不 再 会 得 到 任何 输出 : 


>>> import importl 
> 


这 不 意味 着 在 任何 的 情况 下 ， 都 应 该 这 样 编写 代码 。 在 某 些 情况 中 ， 你 可 能 想 要 显示 输出 来 
确定 输入 模块 。 这 取决 于 你 自身 的 情况 。 我 们 的 目标 是 提供 实效 的 编程 例子 来 屏蔽 副作用 。 


14.4.2 execfile() 

显然 ， 导 入 模块 不 是 从 另外 的 Python 脚本 中 执行 Python 脚本 最 可 取 的 方法 。 那 也 就 不 是 导入 
过 程 。 导 入 模块 的 副作用 是 导致 最 高 级 代码 运行 。 

这 章 一 开始 ， 我 们 描述 了 如 何 通 过 文件 对 象 ， 使 用 exec 语 句 来 读 取 Python 脚 本 的 内 容 并 执 
行 。 下 面 的 代码 给 出 了 例子 : 


f = open(filename, 'r') 
exec f 


f.close() 


这 3 行 可 以 调用 execfile() 来 换 掉 : 


execfile(filename) 


虽然 上 述 代 码 执行 了 一 个 模块 ， 但 是 仅 可 以 在 现 有 的 执行 环境 下 运行 (比如 ， 它 自己 的 全 局 
和 局 部 的 名 称 空间 ) 。 在 某 些 情况 下 ， 可 能 需要 用 不 同 全 局 和 局 部 的 名 称 空间 集合 ， 而 不 是 
默认 的 集合 来 执行 模块 。execfile() 有 函数 的 语法 非常 类 似 于 eval() 有 函数 的 。 


execfile(filename, globalszglobals(), locals-locals()) 


类 似 eval()、globals 和 |ocals 都 是 可 选 的 ， 如 果 不 提供 参数 值 的 话 ， 上 默认 为 执行 环境 的 名 称 空 
间 。 如 果 只 给 定 globals， 那 么 locals 默 认 和 globals 相 同 。 如 果 提 供 locals 值 的 话 ， 它 可 以 是 任 
何 映射 对 象 (一 个 定义 覆盖 了 getitem() 的 对 象 ) 。 在 2.4 之 前 ，locals 必 须 是 一 个 字典 。 注 
意 : (在 修改 的 时 候 ) 小 心 局 部 名 称 空间 。 比 较 安 全 的 做 法 是 传 入 一 个 庶 假 的 "locals” 字 典 并 


检查 是 否 有 副作用 。execfile() 不 保证 不 会 修改 局 部 名 称 空间 。 见 《Python 库 参 考 手 册 》 
(Python Library Reference Manual) 对 execfile() 的 解释 。 


14.4.3 ”将 模块 作为 脚本 执行 


Pythpon2.4 里 加 入 了 一 个 新 的 命令 行 选项 (或 开关 ) ， 允 许 从 shell 或 DOS 提 示 符 ， 直 接 把 模 
块 作为 脚本 来 执行 。 当 以 脚本 的 方式 来 书写 模块 的 时 候 ， 执 行 它们 是 很 容易 的 。 可 以 使 用 命 
令 行 从 你 的 工作 目录 调用 你 的 脚本 。 


$ myScript.py # or $ python myScript.py 


如 果 模 块 是 标准 库 的 一 部 分 ， 安 装 在 site-packages 里 ， 或 者 仅仅 是 包 里 面 的 模块 ， 处 理 这 样 
的 模块 就 不 是 那么 容易 了 ， 尤 其 是 它们 共享 了 已 存在 的 同名 Python 模块 。 举 例 来 说 ， 你 想 运 
行 免费 的 Python web 服 务 器 ， 以 便 创 建 和 测试 你 自己 的 Web 页 面 和 CGI 脚本 。 


你 将 必须 在 命令 行 敲 入 如 下 的 字符 : 


$ python /usr/local/lib/python2x/CGIHTTPServer.py 
Serving HTTP on 0.0.0.0 port 8000 


这 是 段 很 长 的 命令 ， 如 果 它 是 第 三 方 的 ， 你 不 得 不 深入 到 site-packages 去 找到 它 站 正 定位 的 
地 方 。 如 果 没 给 出 完全 的 路 径 名 ， 可 以 从 命令 行 运行 一 个 模块 ， 并 让 Python 的 导入 机 制 为 我 
们 做 这 种 跑腿 工作 吗 ? 答案 是 肯定 的 。 我 们 可 以 用 Python-c 命 令 行 开关 : 


$ python -c "import CGIHTTPServer; CGIHTTPServer.test()" 


该 选项 允许 你 指定 你 想 要 运行 的 Python 语 句 。 虽 然 它 可 以 这 样 工 作 ， 但 问题 是 name 模块 
不 是 ' man ... 而 是 你 正在 使 用 的 模块 (需要 的 话 ， 你 可 以 参阅 前 面 的 3.4.1 小 节 复 习 

. name ) 。 在 最 后 一 行 ， 解 释 器 通过 import 装 载 了 你 的 模块 ， 并 不 是 它 当 作 脚 本 。 因 为 如 
此 ， 所 有 在 if name ==' main "之 下 的 代码 是 不 会 执行 的 ， 所 以 你 不 得 不 手动 地 调用 
模块 的 test() 函 数 ， 就 如 同 前 面 我 们 所 做 的 一 样 。 所 以 我 们 想 同时 要 两 者 的 优点 能够 在 类 
库 中 执行 作为 脚本 的 模块 而 不 是 作为 导入 的 模块 。 这 就 是 -m 参 数 的 动机 。 现 在 可 以 像 这 样 运 
行 脚本 : 





$ python -m CGIHTTPServer 


这 是 不 小 的 改进 。 尽 管 如 此 ， 还 没有 完全 如 预想 那样 实现 特性 。 所 以 在 Python2.5 中 ，-m 开 关 
有 了 更 多 的 兼容 性 。 从 2.5 开 始 ， 你 可 以 用 相同 的 参数 来 运行 包 内 或 需要 特别 加 载 的 模块 ， 比 
如 zip 文 件 里 的 模块 ， 这 是 在 2.3 加 入 的 特性 〈12.5.7 小 节 ，396 页 ) 。Python2.4 只 让 你 执行 标 
准 的 库 模块 。 所 以 初始 版 本 的 -m 选 项 是 不 能 运行 特殊 的 模块 如 PyCHecker (Python 的 lint) > 
或 其 他 的 性 能 测试 器 (注意 这 些 是 装载 和 运行 其 他 模块 的 模块 ) 。 但 是 2.5 版 本 解决 了 这 个 问 
题 。 


14.5 执行 其 他 (3EPython) 程序 


在 Python 程序 里 我 们 也 可 以 执行 非 Python 程 序 。 这 些 程序 包括 了 二 进 制 可 执行 文件 ， 其 他 的 
shell 脚 本 等 。 所 有 的 要 求 只 是 一 个 有 效 的 执行 环境 ， 上 比如， 允许 文件 访问 和 执行 ， 脚 本 文件 
必须 能 访问 它们 的 解释 器 (perl、bash 等 )， 二 进 制 必 须 是 可 访问 的 (和 本 地 机 器 的 构架 兼 


&) 


最 终 ， 程 序 员 必须 考虑 Python 脚本 是 否 必 须 和 其 他 将 要 执行 的 程序 通信 。 有 些 程序 需要 输 
入 ， 而 有 的 程序 返回 输出 以 及 执行 完成 时 的 错误 代码 ， 也 许 有 的 两 者 都 做 。 针 对 不 同 的 环 
境 ，Python 提 供 了 各 种 执行 非 Python 程 序 的 方法 。 在 本 节 讨 论 的 所 有 函数 都 可 以 在 os 模块 中 
找到 。 在 表 14.6 中 ， 我 们 做 了 总 结 (我 们 会 对 那些 只 适合 特定 平台 的 函数 进行 标注 ) ， 作 为 
对 本 节 剩 余部 分 的 介绍 。 


A146 为 外 部 程序 执行 提供 的 os 模块 《人 @ 代 表 Unix F. MEE Windows F) 











34 4i 
system(cmd) RAUF cmd CAREM) . OEPHAZPIEHEE. GRISDHIACER (windows F. Htt € 
t Lh I exec*( I 
forki : 
p BENI 
xecl(file, argo, arg, t à 0. argi 
Crecy arglist) f à xech? 
+ 
execletfile, arg, arg!,.. em) El exec] 1l], MRI P HR UE A env 
execvet file, arglist, em j 有 参数 向 生死 表 ， 其 他 的 和 eveclef) 介 同 
execlpiemá, OO rang l.i.) 与 exec MIEL, (rb re nmmmwm ruvevorn"mt 
execvptcmd, arglisi e f 存 参数 癌 量 列表 ， 与 exec 
execlpet cmd, arg), arg1 em) 相 execip fij, (HO OC 159 15 9 cnv 
cxecvpe(omd, orglist, env) 和 execvp WIF, 8130 0t T 109g E EE A env 
- — va* 05 HPAII args fi K. Ef acu A er 

spawn*"^(mode, file, args|, env]) : 

mode HW u^ 


wait( ) CAREUL VR VK fock 和 exec*o) - IE 9 DO 
*155 ^5 f.i ` i24 
i ; 起 


waitpid(pid, options 


r 
À 
:© 


popen(emd, moder, bufferingrs-) 


FT 
startfile (path) H XA (ESL PALA ned 


a. spawn*()iS Wt & 2, !3 exec* OM CP PCIE Hf 8 个 成 spawnv() i spawnve()7F Python 1.5.2 MA, 其 他 的 6 T spawn) 





ARE Python 1.6 MIA: spawnlp(). spawnlpe(). spawnvyp() 和 spawnvpei A I] T. Unix 平台 


b. Python2.0 新 加 入 的 


随 着 越 来 越 接 近 软 件 的 操作 系统 层面 ， 你 会 发 现 执 行 跨 平 台 程序 (甚至 是 Python 脚本 ) 的 一 
致 性 开始 有 些 不 确定 了 。 上 面 我 们 提 到 在 这 个 小 节 中 描述 的 程序 是 在 Os 模块 中 的 。 事 实 上 ， 
有 多 个 os 模块 。 比 如 说 ， 基 于 Unix 衍 生 系统 (例如 Linux、MacOS X、Solaris、BSD 等 ) 的 模 
块 是 posix 模 块 ，Windows 的 是 nt (无 论 你 现在 用 的 是 哪个 版 本 的 windows; dos 用 户 有 dos 模 
块 ) ， 昌 的 macOS 为 mac 模 块 。 不 用 担心 ， 当 你 调用 import os 的 时 候 ，Python 会 装载 正确 的 
模块 。 你 不 需要 直接 导入 特定 的 操作 系统 模块 。 


在 我 们 看 看 每 个 模块 函数 之 前 ， 对 于 Python2.4 或 者 更 新 版 本 的 用 户 ， 这 里 有 个 subprocess 模 
块 ， 可 以 作为 上 面 所 有 函数 很 好 的 替代 品 。 我 们 本 章 稍 后 部 分 演示 如 何 使 用 这 些 函 数 ， 然 后 
在 最 后 给 出 Subprocess.Popen 类 和 Subprocess.call() 有 函数 的 等 价 使 用 方法 。 


14.5.1 os.system() 


我 们 列表 中 的 第 一 个 函数 是 system()， 一 个 非常 简单 的 函数 ， 接 收 字 符 串 形式 的 系统 命令 并 执 
行 它 。 当 执行 命令 的 时 候 ，Python 的 运行 是 挂 起 的 。 当 我 们 的 执行 完成 之 后 ， 将 会 以 
system() 的 返回 值 形式 给 出 退出 状态 ，Python 的 执行 也 会 继续 。 


system() 保 留 了 现 有 的 标准 文件 ， 包 括 标 准 的 输出 ， 意 味 着 执行 任何 命令 和 程序 显示 输出 都 会 
传 到 标准 输出 上 。 这 里 要 当心 ， 因 为 特定 应 用 程序 比如 公共 网 关 接 口 (common gateway 
interface, CGI) ， 如 果 将 除了 有 效 的 超 文本 标记 语言 (HTML) 字符 串 之 外 的 输出 ， 经 过 标准 
输出 发 送 回 客 户 端 ， 会 引起 Web 浏 览 器 错误 。system() 通 常 和 不 会 产生 输出 的 命令 一 起 使 用 ， 
其 中 的 一 些 命令 包括 了 压缩 或 转换 文件 的 程序 ， 挂 载 磁盘 到 系统 的 程序 ， 或 其 他 执行 特定 任 
务 的 命令 一 一 通过 退出 状态 显示 成 功 或 失败 而 不 是 通过 输入 和 或 输出 通信 。 通 常 的 约定 是 
利用 退出 状态 ，0 表 示 成 功 ， 非 0 表示 其 他 类 型 的 错误 。 





作为 例子 ， 我 们 执行 了 两 个 从 交互 解释 器 中 获取 程序 输入 的 命令 ， 这 样 你 便 可 以 观察 system() 
是 如 何 工 作 的 。 


>>> import os 

»»» result = os.system('cat /etc/motd') 

Have a lot of fun... 

>>> result 

0 

>>> result = os.system('uname -a') 

Linux solo 2.2.13 #1 Mon Nov 8 15:08:22 CET 1999 i586 unknown 


>>> result 


n 
V 


可 以 看 到 pu C COE DEREIINUE ， 我 们 将 其 保存 到 result 变 量 中 。 下 面 是 一 个 
执行 dos 命 令 的 例子 
>>> import os 
>>> result = os.system('dir') 
Volume in drive C has no label 
Volume Serial Number is 43D1-6C8A 
Directory of C: NWINDOWSNTEMP 
«DIR» 01-08-98 $8:39a 
«DIR» 01-08-98 $8:39a 
0 file(s) 0 bytes 
2 dir(s) 572,588,032 bytes free 
>>> result 
0 


14.5.2  os.popen() 


popen() 辑 数 是 文件 对 象 和 system() 辑 数 的 结合 。 它 工作 方式 和 system() 相 同 ， 但 它 可 以 建立 
一 个 指向 那个 程序 的 单 向 连接 ， 然 后 像 访 问 文 件 一 样 访问 这 个 程序 。 如 果 程 序 要 求 输入 ， 那 
么 你 要 用 'w' 模 式 写 入 那个 命令 来 调用 popen()。 你 发 送 给 程序 的 数据 会 通过 标准 输入 接收 到 。 
同样 ， 和 模式 允许 spawn 命 令 ， 那 么 当 它 写 入 标准 输出 的 时 候 ， 你 就 可 以 通过 类 文件 句柄 使 用 
熟悉 的 file 对 象 的 read*() 方 法 来 读 取 输 入 。 就 像 对 于 文件 ， 当 使 用 完毕 以 后 ， 你 应 当 close() 连 
接 。 在 上 面 其 中 一 个 使 用 system() 的 例子 中 ， 我 们 调用 了 unix 程 序 uname 来 给 我 们 提供 机 器 和 
使 用 的 操作 系统 的 相关 信息 。 该 命令 产生 了 一 行 输出 ， 并 直接 写 到 屏幕 上 。 如 果 想 要 把 该 字 
符 串 读 入 变量 中 并 执行 内 部 操作 或 者 把 它 存储 到 日 志文 件 中 ， 我 们 可 以 使 用 popen()。 实 际 
上 ， 代 码 如 下 所 示 : 


>>> import os 
> f = os.popen('uname -a") 
^» data = f.readline() 
>>> f.close() 
>>> print data, 


Linux solo 2.2.13 #1 Mon Nov 8 15:08:22 CET 1999 i586 unknown 


如 你 所 见 ，popen() 返 回 一 个 类 文件 对 象 ; 注意 readline()， 往 往 保留 输入 文本 行 尾 的 newline 


> kk 


字符 。 


14.5.3 os.fork() ` os.exec*() ` os.wait*() 


本 小 节 我 们 不 会 对 操作 系统 理论 做 详尽 的 介绍 ， 只 是 稍稍 地 介绍 一 下 进程 (process) ° fork() 
采用 称 为 进程 的 单一 执行 流程 控制 ， 如 果 你 喜欢 的 话 ， 可 称 之 为 创建 “岔路 口 "。 有 趣 的 事情 发 
+T: 用 户 系 统 同 时 接管 了 两 个 岔路 口 一 也 就 是 说 让 用 户 拥有 了 两 个 连续 且 并 行 的 程序 
(不 用 说 ， 它 们 运行 的 是 同一 个 程序 ， 因 为 两 个 进程 都 是 紧 跟 在 fork() 调 用 后 的 下 一 行 代码 开 
始 执 行 的 ) 。 调 用 fork() 的 原始 进程 称 为 父 进 程 ， 而 作为 该 调用 结果 新 创建 的 进程 则 称 为 子 进 
程 。 当 子 进程 返回 的 时 候 ， 其 返回 值 永远 是 0 ; 当 父 进程 返回 时 ， 其 返回 值 永远 是 子 进 程 的 进 
程 标识 符 (又 称 进程 ID， 或 PID) (这 样 父 进程 就 可 以 监控 所 有 的 子 进程 了 ) PID (process 
ID) 也 是 唯一 可 以 区 分 他 们 的 方式 ! 我 们 提 到 了 两 个 进程 会 在 调用 fork() 后 立刻 运行 。 因 为 代 
码 是 相同 的 ， 如 果 没 有 其 他 的 动作 ， 我 们 将 会 看 到 同样 的 执行 结果 。 而 这 通常 不 是 我 们 想 要 
的 结果 。 创 建 另 外 一 个 进程 的 主要 目的 是 为 了 运行 其 他 程序 ， 所 以 我 们 必须 在 父 进程 和 子 进 
程 返 回 时 采取 分 流 措施 。 正 如 上 面 我 们 所 说 ， 它 们 的 PID 是 不 同 的 ， 而 这 正 是 我 们 区 分 它们 的 
方法 。 
对 于 那些 有 进程 管理 经 验 的 人 来 说 ， 接 下 来 的 这 段 代码 是 再 熟悉 不 过 了 。 但 是 ， 如 果 你 是 新 


手 的 话 ， 一 开始 就 弄 懂 它 是 如 何 工作 的 可 能 就 有 点 困难 了 ， 但 是 一 旦 你 懂 了 ， 就 会 体会 到 其 
中 的 奥妙 。 


ret-os.fork() # 产 生 两 个 进程 ， 都 返回 


if ret==0: # 子 进程 返回 的 PID 是 0 
child suite # 子 进程 的 代码 

else: # 父 进程 返回 是 子 进程 的 PID 
parent_suite # 父 进程 的 代码 


在 代码 第 一 行 便 调 用 了 fork()。 现 在 子 进 程 和 父 进程 同时 在 运行 。 子 进程 本 身 有 虚拟 内 存 地 址 
空间 的 拷贝 ， 以 及 一 份 父 进程 地 址 空间 的 原样 拷贝 一 一 是 的 ， 两 者 几乎 都 是 相同 的 。fork() 返 
回 两 次 ， 意 味 着 父 进 程 和 子 进程 都 返回 了 。 你 或 许 会 问 ， 如 果 它 们 两 个 同时 返回 ， 如 何 区 分 
两 者 呢 ? 当 父 亲 返 回 的 时 候 ， 会 带 有 进程 的 PID。 而 当 子 进程 返回 的 时 候 ， 其 返回 值 为 0° 这 
就 是 区 分 两 个 进程 的 方法 。 


利用 if-else 语 句 ， 我 们 能 给 子 进 程 (redo o fF) 和 父 进程 (else 子 名) 指定 各 自 的 执行 代 
码 。 在 子 进程 的 代码 中 ， 我 们 可 以 调用 任何 exec*() 函 数 来 运行 完全 不 同 的 程序 ， 或 者 同一 个 
程序 中 的 其 他 的 函数 (只 要 子 进 程 和 父 进 程 用 不 同 的 路 径 执行 ) 。 普 遍 做 法 是 让 子 进程 做 所 
有 的 脏 活 ， 而 父 进 程 耐心 等 来 子 进程 完成 任务 ， 或 继续 执行 ， 稍 后 再 来 检查 子 进程 是 否 正 党 
结束 。 


所 有 的 exec*() 函 数 装载 文件 或 者 命令 ， 并 用 参数 列表 (分 别 给 出 或 作为 参数 列表 的 一 部 分 ) 
来 执行 它 。 如 果 适 用 的 话 ， 也 可 以 给 命令 提供 环境 变量 字典 。 这 些 变 量 普遍 用 于 给 程序 提供 
对 当前 执行 环境 的 精确 描述 。 其 中 一 些 著 名 的 变量 包括 用 户 的 名 字 、 搜 索 路 径 、 现 在 的 

shell、 终 端 类 型 、 本 地 化 语言 、 机 器 类 型 、 操 作 系 统 名 字 等 。 


所 有 版 本 的 exec*() 都 会 用 给 定 文件 作为 现在 要 执行 的 程序 取代 当前 ( 子 ) 进程 的 Python 解释 
器 。 和 system() 不 一 样 ， 对 于 Python 来 说 没有 返回 值 (因为 Python 已 经 被 蔡 代 了 ) 。 如 果 因 
为 某 种 原因 ， 程 序 不 能 执行 ， 那 么 Bexec*() 就 会 失败 ， 进 而 导致 引发 异常 。 


接 下 来 的 代码 在 子 进程 中 开始 了 一 个 称 为 “xbil* 的 可 爱 小 巧 的 游戏 ， 而 父 进程 继续 运行 Python 
解释 器 。 因 为 子 进 程 从 不 返回 ， 所 以 无 需 去 顾虑 调用 exec*() 后 的 子 进 程 代码 。 注 意 该 命令 也 
是 参数 列表 中 的 必须 的 第 一 个 参数 。 


ret = os.fork() 

if ret--0: # 子 进程 代码 
execvp('xbill', ['xbill']) 

else: # 父 进程 代码 


os.wait() 


在 这 段 代码 中 ， 还 可 以 看 到 对 Wait() 的 调用 。 当 子 进程 执行 完毕 ， 需 要 它们 的 父 进 程 进行 扫尾 
工作 。 这 个 任务 ， 称 为 “收获 孩子 ”(reaping a child) ， 可 以 用 wati*() 函 数 完成 。 紧 跟 在 fork() 
之 后 ， 父 进程 可 以 等 待 子 进程 完成 并 在 那 进 行 扫尾 。 父 进程 也 可 以 继续 运行 ， 稍 后 再 扫尾 ， 
同样 也 是 用 waits() 函 数 中 的 一 个 。 


不 管 父 进程 选择 了 那个 方法 ， 该 工作 都 必须 进行 。 当 子 进 程 完成 执行 ， 还 没有 被 收获 的 时 
候 ， 它 进入 了 闲置 状态 ， 变 成 了 著名 的 僵尸 进程 。 在 系统 中 ， 应 该 尽量 把 僵尸 进程 的 数目 降 
到 最 少 ， 因 为 在 这 种 状态 下 的 子 进 程 仍 保留 着 在 存活 时 期 分 配给 它们 的 系统 资源 ， 而 这 些 资 
源 只 能 在 父 进 程 收获 它们 之 后 才能 释放 掉 。 


调用 wait() 会 挂 起 执行 (比如 ，waits) ， 直 到 子 进程 (其 他 的 子 进程 ) 正常 执行 完毕 或 通过 信 
号 终止 。wait() 将 会 收获 子 进 程 ， 释 放 所 有 的 资源 。 如 果子 进程 已 经 完成 ， 那 么 wait() 只 是 进 
行 些 收获 的 过 程 。waitpid() 具 有 和 wait() 相 同 的 的 功能 ， 但 是 多 了 一 个 参数 PID (指定 要 等 待 
子 进程 的 进程 标识 符 ) ， 以 及 选项 (通常 是 零 或 用 *OR” 组 成 的 可 选 标志 集合 ) 。 


14.5.4 os.spawn"() 


函数 spawn*() 家 族 和 fork, exec*() 相 似 ， 因 为 它们 在 新 进程 中 执行 命令 ; 然而 ， 你 不 需要 分 别 
调用 两 个 函数 来 创建 进程 ， 并 让 这 个 进程 执行 命令 。 你 只 需 调 用 一 次 spawn*() 家 族 。 由 于 其 
简单 性 ， 你 放弃 了 "跟踪 ? 父 进程 和 子 进 程 执 行 的 能 力 ; 该 模型 类 似 于 在 线程 中 启动 函数 。 还 有 
点 不 同 的 是 你 必须 知道 传 入 spawn*() 的 魔法 模式 参数 。 在 其 他 的 操作 系统 中 (尤其 是 谋 入 式 
实时 操作 系统 (RTOS) ) ，spawn*() 比 fork() 快 很 多 。 不 是 这 种 情况 的 操作 系统 通常 使 用 写 
实 拷贝 (copy-on-write) 技术 。 参 阅 Python 库 参考 手册 来 获得 更 多 spanw*() 的 资料 。 各 种 
spanw*() 家 族 成 员 是 在 1.5 和 1.6 (81.6) 之 间 加 入 的 。 


14.5.5 subprocess 模 块 


在 Python 2.3 出 来 之 后 ， 一 些 关 于 popen5 模 块 的 工作 开始 展开 。 一 开始 该 命名 继承 了 先前 
popenx*() 函 数 的 传统 ， 但 是 并 没有 延续 下 来 ， 该 模块 最 终 被 命名 为 Subproess， 其 中 一 个 类 叫 
Popen， 集 中 了 我 们 在 这 章 讨论 的 大 部 分 面向 进程 的 函数 。 同 样 也 有 名 为 call() 的 便捷 函数 ， 
可 以 轻易 地 取代 了 os.system()。 在 Python 2.4 中 ，subprocess 初 次 登场 。 下 面 就 是 演示 该 模 
块 的 例子 : 


MER os.system() 


Linux 上 的 例子 : 
from subprocess import l 
> import os 
res IE". eti T 1') 
nux 1 Į 1.18-1-686 #4 à l 1 E € 
GNU/ Li X 


Win32 例 子 


>>> res = call(('dir', 
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r'c:NwindowsNtemp'), 


Volume in drive C has no label. 


Volume Serial Number is F4C9-1C38 


Directory of c:NwindowsNtemp 


03/11/2006 
03/11/2006 
02/21/2006 
02/21/2006 


02:08 AM <DIR> 
02:08 AM «DIR» 
08:45 PM 
07:02 PM 


2 File(s) 
3 Dir(s) 


取代 os.popen() 


55,001,104,384 bytes free 


851 install.log 
444 tmp.txt 


1,295 bytes 


创建 Popen() 实 例 的 语法 只 比 调 用 os.popen() 函 数 复杂 了 一 点 


>>> from subprocess import Popen, PIPE 


>>> f = Popen(('uname', 


>>> data = f.readline() 


>>> f.close() 


>>> print data, 


Linux starship 2.4.18-1-686 #4 Sat Nov 29 10:18:26 EST 2003 i686 


GNU/Linux 
»»» f = Popen('who', 


»»» f.close() 
>>> for eachLine in data: 


... print eachLine 


Wesc 
Wesc 
Wesc 
Wesc 


Wesc 


conso 
ttypl 
ttyp2 
ttyp3 
ttyp4 


le Mar 
Mar 
Mar 
Mar 
Mar 


11 
11 
11 
11 
11 
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t-a' 


12:44 
16:29 
16:40 
16:49 
17:51 


), stdout-PIPE).stdout 


stdout*"PIPE).stdout 
»»» data = [ eachLine.strip() for eachLine in f ] 


(192.168.1.37) 
(192.168.1.37) 
(192.168.1.34) 


表 14.7 列 出 了 可 以 执行 上 述 任务 的 元 数 (及 其 模块 ) 。 
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shell=True) 


660 


X 147 各 种 文件 执行 函数 











创建 subprocess 的 便捷 函数 。Popen WAAR, 
geo SM IC 











ritu sun A 让 
oOwWpopen2 popen2') | 执行 文件 、 打 开 广 件 、 从 新 创建 的 运行 程序 读 取 《stdouwt) , EERIIKEUT TS Catdin) 
os pupa? popen?'Ü | 执行 文件 、 ] H rn". AB 创建 的 进行 程序 读 取 《sdout 和 stderr) « SN RIETI (stdin)》 
os/popen2.popen4"( ) 换行 文件 、 打 开 文 件 、 从 新 创建 的 运行 程 将 读 取 《结合 stdout，stderr) . REPTINUTS. (stdin) 
E commands getoutput() e TR FPEM. FNE 4 090981 
bfi 


A 3 9H d C91; !3 os.systemQ) 4, 018 
subprocess.call() 





a Python2.0 MEMA 
b. Python2.0 对 加 入 到 os 和 popen2 Hiks 
c Python2.4 对 如 入 ， 


14.6 ZRA 


在 Python 历史 某 个 时 期 内 ， 存 在 着 使 用 了 rexec 和 bastion 模 块 的 限制 执行 的 概念 。 第 一 个 模块 
允许 沙 金 (sandbox) 中 的 执行 代码 修改 内 建 对 象 。 第 二 个 模块 用 来 过 滤 属 性 和 包装 你 的 类 。 
然而 ， 由 于 一 个 显著 的 缺点 和 弥补 安全 漏洞 的 困难 ， 这 些 模 块 便 被 废弃 了 。 那 些 维护 使 用 了 
这 些 模块 的 老 代 码 的 人 员 可 能 会 用 到 这 两 个 模块 的 文档 。 


14.7 结束 执行 


当 程序 运行 完成 ， 所 有 模块 最 高 级 的 语句 执行 完毕 后 退出 ， 我 们 便 称 这 是 干净 的 执行 。 可 能 
有 很 多 情况 ， 需 要 从 Python 提前 退出 ， 比 如 某 种 致命 错误 ， 或 是 不 满足 继续 执行 的 条 件 的 时 
候 。 


在 Python 中 ， 有 各 种 应 对 错误 的 方法 。 其 中 之 一 便 是 通过 异常 和 异常 处 理 。 另 外 一 个 方法 便 
是 建造 一 个 “清扫 器 "方法 ， 这 样 便 可 以 把 代码 的 主要 部 分 放 在 if 语 名 里， 在 没有 错误 的 情况 下 
执行 ， 因 而 可 以 让 错误 的 情况 "正常 地 "终结 。 然 而 ， 有 时 也 需要 在 退出 调用 程序 的 时 候 ， 返 回 
错误 代码 以 表明 发 生 何 种 事件 。 


14.7.1 sys.exit() and SystemExit 


立即 退出 程序 并 返回 调用 程序 的 主要 方式 是 SySs 模 块 中 的 exit() 函 数 。Ssys.exit() 的 语法 为 : 当 调 
用 Sys.exit() 时 ， 就 会 引发 systemExit() 异 常 。 除 非 对 异常 进行 监控 〈 在 一 个 try 语 名 和 合适 的 
except a F) ， 异 常 通常 是 不 会 被 捕捉 到 或 处 理 的 ， 解 释 器 会 用 给 定 的 状态 参数 退出 ， 如 
果 没 有 给 出 的 话 ， 该 参数 默认 为 0。System Exit 是 唯一 不 看 作 错 误 的 异常 。 它 仅仅 表示 要 退出 
Python 的 愿望 。 


sSys.exit(status-0) 
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Sys. 


exit() 经 常用 在 命令 调用 的 中 途 发 现 错误 之 后 ， 比 如 ， 如 果 参 数 不 正 确 ， 无 效 ， 或 者 参数 


数目 不 正确 。 下 面 的 例子 14.4 (args.py) 仅仅 是 一 个 测试 脚本 ， 在 正确 执行 之 前 需要 给 出 确 
定数 目的 参数 。 


执行 


调用 Sys.exit() 使 Python 解释 器 退出 。exit() 的 任何 整 型 参数 都 会 以 退出 状态 返回 


值 默认 为 0; 
1 #!/usr/bin/env python 
2 
3 import sys 
4 
5 def usage (): 
6 print 'At least 2 arguments (incl. cmd name). ' 
7 print 'usage: args.py argl arg2 [arg3... ]' 
8 sys.exit (1) 
9 
10 argc = len(sys.argv) 
11 £ argo « 3: 
12 usage () 
13 print "number of args entered:", argc 


14 print "args (incl. cmd name) were:", sys.argv 


这 个 脚本 我 们 得 到 如 下 输出 : 


$ args.py 

At least 2 arguments required (incl. cmd name). 
usage:  args.py argl arg2 [arg3... ] 

$ args.py XXX 

At least 2 arguments required (incl. cmd name). 
usage:  args.py argl arg2 [arg3... ] 

$ args.py 123 abc 

number of args entered: 3 

args (incl. cmd name) were: ['args.py', '123', 'abc'] 
$ args.py -x -2 foo 

number of args entered: 4 

args (incl. cmd name) were: ['args.py', '-x', '-2', 
'foo'] 


给 调用 者 ， 该 


许多 命令 行 驱动 的 程序 在 进行 之 前 ， 用 脚本 的 核心 功能 测试 了 输入 的 有 效 性 。 如 果 验 证 失 
那么 便 调 用 usage() 有 函数 去 告知 用 户 什 么 样 的 问题 会 导致 这 个 错误 ， 并 “提示 "用 户 如 何 才 
能 正确 地 调用 脚本 。 


败 ， 


14 


.717.2 Sys.exitfunc() 


sys.exitfunc() 黑 认 是 不 可 用 的 ， 但 你 可 以 改写 它 以 提供 额外 的 功能 。 当 调用 了 sys.exit() 并 在 解 
释 器 退出 之 前 ， 就 会 用 到 这 个 函数 了 。 这 个 函数 不 带 任何 参数 的 ， 所 以 你 创建 的 函数 也 应 该 
是 无 参 的 。 

如 果 Sys.exitfunc 已 经 被 先前 定义 的 exit 函 数 履 盖 了 ， 最 好 的 方法 是 把 这 段 代 码 作 为 你 exit() 函 
数 的 一 部 分 来 执行 。 一 般 说 来 ，exit 骂 数 用 于 执行 菜 些 类 型 的 关闭 活动 ， 比 如 关闭 文件 和 网 络 
连接 ， 最 好 用 于 完成 维护 任务 ， 比 如 释放 先前 保留 的 系统 资源 。 


下 面 的 例子 介绍 了 如 何 设 置 exit() 函 数 ， 如 果 已 经 被 设置 了 ， 则 确保 执行 该 函数 : 


import sys 


prev exit func = getattr(sys, 'exitfunc', None) 


def my exit func(old exit = prev exit func): 
z - 

# 进行 清理 

z 


if old exit is not None and callable(old exit): 


old exit() 


sys.exitfunc = my exit func 


在 清理 执行 以 后 ， 我 们 执行 了 老 的 exit() 函 数 。getattr() 调 用 只 是 检查 了 先前 的 exitfunc() 是 否 已 
经 定义 。 如 果 没 有 ， 那 么 prev_exit func 赋 值 为 None， 否 则 ，prev_exit func € Jexiti žr% 
的 别名 ， 然 后 作为 参数 传 入 我 们 的 新 exit 函 数 ，my_exit func。 


对 getattr() 的 调用 可 以 这 样 写 : 


if hasattr(sys, 'exitfunc'): 
prev exit func = sys.exitfunc # getattr (sys, 'exitfunc') 
else: 


prev exit func = None 


14.7.3 os. exit() žx 


oOS 模 块 的 “exit() 函 数 不 应 该 在 一 般 应 用 中 使 用 〈 平 台 相 关 ， 只 适用 特定 的 平台 ， 比 如 基于 
Unix 的 平台 ， 以 及 Win32 平 台 ) 。 其 语法 为 : 


os. exit(status) 


Zt jt Dt hg 7 i6 5 sys.exit()fesys. d ， 根 本 不 执行 任何 清理 便 立 即 退 出 
api o 与 Sys.exit() 不 同 ， 状 态 参 数 是 必需 的 。 通 过 sys.exit() 退 出 是 退出 解释 器 的 首选 方 
法 。 


14.7.4 os.kill() Function 


os 模块 的 kill() 却 数 模拟 传统 的 unix 取 数 来 发 送信 号 给 进程 。kill() 参 数 是 进程 标识 数 (PID) 和 
你 想 要 发 送 到 进程 的 信号 。 发 送 的 典型 信号 为 SIGINT、SIGQUIT， 或 更 彻底 地 ，SIGKILL > 
来 使 进 程 终结 9 


14.8 各 种 操作 系统 接口 


本 章 我 们 已 看 到 各 种 通过 os 模块 和 操作 系统 进行 交互 的 方法 。 我 们 看 到 的 大 多 数 函 数 都 是 处 
理 文 件 或 外 部 进程 执行 。 这 里 有 些 方 法 允许 对 现在 的 用 户 和 进程 有 较 特 殊 的 动作 ， 我 们 将 简 
要 地 看 看 。 表 14.8 中 描述 的 大 部 分 函数 只 在 POSIX 系 统 上 工作 ， 除 非 标 明了 适用 于 Windows 
环境 。 


















































表 14.8 各 种 OS 模块 属性 加 也 适用 于 win32) 
m ik N tt 5Á MW 
uname() 获得 系统 信息 (ENUE, MEREK, PTAH, KEHRT 
getuid(y'setuid(wid) i 获取 ; 设置 现在 进程 的 Ki Emm u : 
getpid(y/getppid) 获取 真正 的 现在 / 父 进程 ID (PID) S 
getgidOsetgidigid) E TELLIN 
getsid(y'setsid() KRA ID (SD) 8 创建 和 返回 TT? SID 
umask(mask) 设置 现在 的 数字 unmask, PEENE (mask 用 于 文件 许可 ) Tw] 
getenv(ev)! putenv(ev, value), environ | 获取 和 设置 FAE ev 的 值 ，os.envion IMPER RE AT Po 918 e A Y ^O 
- geteuid(ysetegidi) | 获取 /设置 当前 过 程 的 有 效用 户 TD. (GID) 
getegidi y»etegidi) | 获取 /设置 当前 进程 的 有 效 组 ID (GID) 
getpgid(pidy setpgid(pid, pgrp) | f mi 设置 进 进程 GID i2 f PID; 对 于 get, 5n" pid Jj 0, (Eis PU (OS PUER! GID 
^ getoginO | 返回 运行 现在 进 menn gx 
mes) — | 返回 各 种 进 加 时 期 的 n 
- strerror(code) | iR ELEM UUCPM Im 9 a A Tw] 
pdm | 远 回 代表 在 过 去 1，5，15 分 镍 内 的 系统 平均 负 欣 值 的 元 组 
a Python23 对 加 入 ， 


14.9 相关 模块 


在 表 14.9 中 ， 除 了 os 和 sys 模 块 ， 你 还 可 以 找到 与 这 章 执行 环境 主题 相关 的 模块 列表 。 
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W 14.9 执行 环境 相关 模块 
"m sx mo x 
atexit* 注册 当 Python ORE 2331 184 (651817 6) 
pip? 提供 额外 的 在 os.popen 之 上 的 功能 提供 通过 标准 文件 和 其 他 的 进程 交互 的 能 力 : 对 于 Python24 
和 更 新 的 版 本 ， 使 用 subpross0 


提供 额外 的 在 os.system 之 上 的 功能 。 把 所 有 的 程序 输出 保存 在 返回 的 学 符 电 中 (与 输出 到 屏幕 的 


— 相反 》; 对 于 Python2.4 KORG (8/804. 478 subpross 
getopt 在 这 样 的 应 用 程序 中 的 处 理 选项 和 命令 行 参数 
site 处 理 site-specific 模块 或 包 
platform" 语 层 平台 和 架构 的 属性 
subprocess’ W GEBIBHUHBOSRORMAEUS, LEA ossystem(). osspawn*(). ospopen*(. popen2.* A! command. * ) 


a Python2.0 时 加 入 。 
b. Python2.3 HMA. 
€. Python2.4 时 加 入 。 


14.10 练习 
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14-1 : 可 调用 对 象 。 说 出 Python 中 的 可 调用 对 象 。exec 语 句 和 内 建 函 数 eval() 有 什么 不 
同 ? 


14-2.input() 和 raw.input()。 内 建 函 数 raw_input() 和 input() 有 什么 不 同 ? 
14-3 - 执行 环境 。 创 建 运 行 其 他 Python 脚 本 的 Python 脚 本 。 


14-4.0S.system()。 选 择 熟 悉 的 系统 命令 ， 该 命令 执行 任务 时 不 需要 输入 ， 也 不 输出 到 屏 
幕 或 根本 不 输出 任何 东西 。 et 程序 附加 题 : 你 的 解决 方案 移植 到 
Subprocess.call()。 


14-5.commands.getoutput()。 用 commands.getoutput() 解 决 前 面 的 问题 。 
14-6.popen() 家 族 。 选 择 熟悉 的 系统 命令 ， 该 命令 从 标准 输入 获得 文本 ， 操 作 或 输出 数 
据 。 使 用 os.popen() 与 程序 进行 通信 。 输 出 到 哪儿 呢 ? 使 用 popen2.popen2() 代 替 。 
14-7.subprocess 模 块 。 把 先前 问题 的 解决 方案 移植 到 Subprocess 模 块 。 
14-8.exit 函 数 。 设 计 一 个 在 程序 退出 时 的 函数 。 安 装 到 sys.exitfunc()， 运 行程 序 ， 演 示 你 
exit Zt 9f ERAT o 
14-9.shells ° &|s£shell (操作 系统 接口 ) 程序 。 给 出 接受 操作 系统 命令 的 命令 行 接口 
(任意 平台 ) 。 
附加 题 1 : 支持 管道 ( 见 os 模 块 中 的 dup()、dub2() 和 pipe() 有 函数 ) 。 管 道 过 程 允 许 进 
程 的 标准 输入 连接 到 另 一 个 进程 的 标准 输入 。 


附加 题 2 : 用 括号 支持 逆序 的 管道 ， 给 shell 一 个 函数 式 编程 接口 。 换 名 话说 ， 支 持 更 
加 函数 式 风 格 如 ...sort (grep (ps -ef, root) , -n, +1) ， 而 不 是 ps -ef | grep root | 
sort -n+1... 这 样 的 命令 。 


14-10.fork()/exec*() 和 spawn*() 的 比较 。 使 用 fork()-exec*() 对 和 spawn*() 家 族 函 数 有 什么 
不 同 ? 哪 一 组 的 功能 更 强 ? 


14-11. 生 成 和 执行 Python 代码 。 用 funcAttrs.py 脚 本 〈 例 14.4) 加 入 测试 代码 到 已 有 程序 
的 函数 中 。 创 建 一 个 测试 框架 ， 每 次 遇 到 你 特殊 的 函数 属性 ， 它 都 会 运行 你 的 测试 代 
AU o 
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第 15 章 ”正则 表达 式 


本 章 主 题 

e 引言 /动机 

e 特别 的 字符 和 符号 
4 正则 表达 式 与 Python 


* re 模块 


15.1 引言 /动机 


处 理 文本 和 数据 是 件 大 事 。 如 果 你 不 相信 我 说 的 话 ， 请 仔细 看 看 现 如 今 的 计算 机 主要 都 在 做 
些 什么 工作 : 文字 处 理 、 网 页 填 表 、 来 自 数 据 库 的 信息 流 、 股 票 报价 信息 、 新 闻 列 表 ， 这 个 
清单 还 会 不 断 地 增长 。 因 为 我 们 可 能 不 知道 这 些 需要 计算 机 编程 处 理 文 本 或 数据 的 具体 内 

容 ， 所 以 能 把 这 些 文本 或 数据 以 菜 种 可 被 计算 机 识别 和 处 理 的 模式 表达 出 来 是 非常 有 用 的 。 


假设 我 在 运营 一 个 电子 邮件 档案 公司 ， 而 你 是 我 的 一 位 顾客 ， 比 如 说 ， 你 想 获得 自己 去 年 二 
月 份 收 发 的 所 有 邮件 ， 如 果 我 能 设计 一 个 计算 机 程序 来 整理 信息 然后 将 它 转发 给 你 ， 而 不 是 
通过 人 工 方法 通读 你 的 邮件 后 再 手动 地 处 理 你 的 请 求 ， 那 会 非常 不 错 。 因 为 如 果 有 人 看 了 你 
的 邮件 信息 ， 哪 怕 只 是 用 眼睛 瞄 一 下 邮件 上 的 时 间 ， 你 可 能 都 会 对 此 感到 担心 (甚至 愤 

怒 ) 。 又 比如 ， 你 可 能 会 认为 凡是 带 有 “ILOVEYOU” 这 样 主题 的 邮件 都 是 已 感染 病毒 的 信 
息 ， 并 要 求 从 你 的 个 人 邮箱 中 删除 它们 。 这 就 引出 一 个 问题 ， 我 们 如 何 通 过 编程 使 计算 机 具 
有 在 文本 中 检索 某 种 模式 的 能 力 。 


正则 表达 式 (RE) 为 高 级 文本 模式 匹配 ， 以 及 搜索 -替代 等 功能 提供 了 基础 。 正 则 表达 式 
(RE) 是 一 些 由 字符 和 特殊 符号 组 成 的 字符 串 ， 它 们 描述 了 这 些 字符 和 字符 的 某 种 重复 方 
式 ， 因 此 能 按 某 种 模式 匹配 一 个 有 相似 特征 的 字符 串 的 集合 ， 因 此 能 按 某 模式 匹配 一 系列 有 
相似 特征 的 字符 串 ， 见 图 15-1。 换 名 话说 ， 它 们 能 匹配 多 个 字符 串 一 -一 个 只 能 匹配 一 个 字 
符 串 的 RE 模式 是 乏味 且 毫 无 作用 的 ， 你 说 是 不 是 ? 
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E 15-1 
正则 表达 式 引 擎 


图 15-1 你 可 以 用 这 个 正则 表达 式 匹 配 有 效 的 Python 标识 符 。 "IA-Za-zWw-" $9 & 3€ : 第 一 
个 字符 是 字母 ， 即 ， 由 大 写字 母 A~Z 或 是 小 写字 母 a~z 组 成 ， 它 后 面 至 少 跟 有 一 个 (或 更 多 ) 
由 字母 或 数字 组 成 的 字符 Aw) 。 如 图 ， 你 看 到 有 很 多 字符 串 被 过 滤 ， 只 有 那些 符合 我 们 要 
求 的 RE 模式 的 字符 串 被 筛选 出 来 。 比 如 ，'4XZ”， 因 为 它 是 以 数字 开头 的 ， 所 以 被 过 滤 了 。 


第 15 章 “正则 表达 式 


Python 通过 标准 库 的 re 模块 支持 正则 表达 式 (RE) ， 本 节 我 们 将 简要 地 介绍 一 下 。 限 于 篇 
幅 ， 内 容 将 仅 涉 及 Python 编程 中 正则 表达 式 (RE) 方面 最 常见 的 内 容 。 你 们 〈 对 正则 ) 的 经 
Jb (ARER) 肯定 不 同 。 我 们 强烈 建议 你 阅读 一 些 官方 帮助 文档 和 与 此 主题 有 关 的 文本 。 
那么 你 对 字符 囊 的 理解 方式 就 会 有 所 改变 。 


核心 笔记 : 搜索 与 匹配 的 比较 


本 章 通 篇 涉及 到 对 搜索 和 匹配 用 法 的 讲述 。 当 我 们 完全 讨论 与 字符 串 中 模式 有 关 的 正则 表达 
式 时 ， 我 们 会 用 术语 “匹配 ”(matching) ， 指 的 是 术语 "模式 匹配 ”(pattern-matching) 。 在 
Python 专门 术语 中 ， 有 两 种 主要 方法 完成 模式 匹配 : 搜索 (searching) 和 匹配 

(matching) 。 搜 索 ， 即 在 字符 串 任 意 部 分 中 搜索 匹配 的 模式 ， 而 匹配 是 指 ， 判 断 一 个 字符 
串 能 否 从 起 始 处 全 部 或 部 分 的 匹配 某 个 模式 。 搜 索 通过 search() 有 函数 或 方法 来 实现 ， 而 匹配 是 
以 调用 match() 亟 数 或 方法 实现 的 。 总 之 ， 当 我 们 说 模式 的 时 候 ， 我 们 全 部 使 用 术语 “匹配 ” 
(matching) ; 我 们 按照 Python 如 何 完成 模式 匹配 的 方式 来 区 分 “搜索 "和 “匹配 ”。 

你 的 第 一 个 正则 表达 式 

我 们 上 面 已 经 提 到 ， 正 则 表达 式 是 含有 文本 和 特别 字符 的 字符 囊 ， 这 些 文本 和 特别 字符 描述 
的 模式 可 以 识别 各 种 字符 串 。 我 们 还 简单 冰 述 了 正则 表达 式 字母 表 ， 以 及 用 于 匹配 通用 文本 
的 正则 表达 式 字 母 表 一 一 所 有 大 小 写字 母 及 数字 的 集合 。 也 存在 特别 的 字母 表 ， 比 如 ， 只 含 
有 字符 “0" 和 “1" 的 字母 表 。 该 字母 表 可 以 表示 所 有 二 进 制 整 型 的 集合 ， 即 ,*0,”“1,” “00,” “01, 
“10,” “11,” 100," ° 

让 我 们 看 看 正则 表达 式 的 基本 情况 ， 虽 然 正则 表达 式 党 被 视 为 是 “高 级 主题 "， 但 是 有 时 候 它 们 
也 是 非常 简单 的 。 我 们 列 出 一 些 用 一 般 文 本 的 标准 字母 组 成 简单 的 正则 表达 式 及 它们 所 描述 
的 字符 串 。 以 下 的 正则 表达 式 是 最 基本 、 最 普通 的 。 它 们 仅 由 一 个 字符 串 定 义 了 一 个 模式 ， 
该 模式 仅 匹配 这 个 字符 串 本 身 ， 该 字符 串 由 正则 表达 式 定义 。 以 下 是 正则 表达 式 (RE) 和 匹 
配 它们 的 字符 串 。 


正则 表达 式 模式 匹配 的 字符 串 。 


foo foo 
Python Python 
abc123 abc123 
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上 表 中 第 一 个 正则 表达 式 模式 是 “foo”。 这 个 模式 不 包含 任何 特殊 符号 去 匹配 其 他 符号 ， 它 仅 
匹配 自身 所 描述 的 ， 所 以 只 有 字符 串 “fo0” 匹 配 此 模式 。 同 理 ，“Python” 和 “abcl23” 也 一 样 。 正 
则 表达 式 的 强大 之 处 在 于 特殊 符号 的 应 用 ， 特 殊 符号 定义 了 字符 集合 、 子 组 匹配 、 模 式 重复 
次 数 。 正 是 这 些 特殊 符号 使 得 一 个 正则 表达 式 可 以 匹配 字符 串 集 合 而 不 只 是 一 个 字符 串 。 


15.2 正则 表达 式 使 用 的 特殊 符号 和 字符 


现在 ， 我 们 来 介绍 最 常用 的 元 字符 (metacharacter ) 特殊 字符 和 符号 ， 正 是 它们 赋予 了 
正则 表达 式 强 大 的 功能 和 灵活 性 。 正 则 表达 式 中 最 常见 的 符号 和 字符 见 表 15.1。 





Æ 15.1 正则 者 达 式 中 最 常见 的 符号 和 字符 
wa [semen o i e 
oma CT TE m 
- meme amm —  —  — T 
-— qmememm | —— 
p memmemmm | nns 
-—  [memaenmzwwakexasx | enemer 
-  memmemmrwesk-xagk | eam 
mm | m 
mnie | — n5 
uy |W MMW Penn 
mm E 
(oi  [sexemememea-hem | wrtenea 


TüR EET RHACPHUXOS EGIT ET. BEANA 


[^aeiou][^A-Za-z0-9 ) 





(如果 在 此 字符 集中 出 现 》 


CHM BH OEUBUNERN"T TN". NUER WULIC ICE "T [az] 
63 匹配 封闭 括号 中 正则 表达 式 (RE)》， 基 保存 为 子 组 ((0-9)(3)?, f Coolu)bar 


特殊 字符 


4 区 配 任 何 数字 ， 和 | 个) 一 样 ‘WD 是 W 的 反 义 任何 非 数 罕 字 ) dataid*.txt 


区 了 配 任何 空白 符 ， 和 [nul 相同 ， GS 是 mms x) 


匹配 单词 边界 OB 是 \b fs X) 


匹配 已 保存 的 子 组 《请 参考 上 面 的 正则 表达 式 符 号 ， (-) 


EKER e (P, New» x. Ny) 
罗 配 字符 申 的 起 给 《 结 来 ) 





15.2.1 用 管道 符号 (|) 匹配 多 个 正则 表达 式 模 式 


道 符号 (|) ， 就 是 你 键 瘟 上 的 坚 柜 ， 表 示 一 个 或 操作 ， 它 的 意思 是 选择 被 管道 符号 分 隔 的 
个 不 同 的 正则 表达 式 中 的 一 个 。 例 如 ， 下 面 的 一 些 使 用 或 操作 的 模式 ， 和 它们 所 匹配 的 字 
$ 


ROW cw 
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正则 表达 式 模 式 匹配 的 字符 串 


at |home at, home 
r2d2|c3po r202, G3po 
bat|bet|bit bat, bet, bit 


有 了 这 个 符号 ， 正 则 表达 式 的 灵活 性 增强 了 ， 使 得 它 可 以 匹配 不 止 一 个 字符 囊 ，“ 或 "(操作 ) 
有 时 候 也 被 叫做 "联合 ”(union ) 或 者 逻辑 或 (OR) 。 


15.2.2 ”匹配 任意 一 个 单个 的 字符 C) 


点 字符 或 句点 〈.) 符号 匹配 除 换行 符 (NEWLINE) 外 的 任意 一 个 单个 字符 (Python 的 正则 

表达 式 有 一 个 编译 标识 [S or DOTALL]， 该 标识 能 去 掉 这 一 限制 ， 使 (.) 在 匹配 时 包括 换行 符 
(NEWLINE) ) 。 无 论 是 字母 数字、 不 包括 An" 的 空白 符 、 可 打印 的 字符 、 还 是 非 打 印字 

符 ， 或 是 一 个 符号 、 点 C) 都 可 以 匹配 他 们 。 


ERAKAR 匹配 的 字符 串 

f.o 在 “f” 和 “o” 中 间 的 任何 字符 ， 如 fao，f9o，f#o 等 
任意 两 个 字符 

.end 匹配 在 字符 串 end 前 面 的 任意 一 个 字符 


问 : 我 怎样 才能 匹配 句点 (dot) 或 句号 (period) ? 


答 : 为 了 明确 地 匹配 一 个 句点 (dot) 本 身 ， 你 必须 (在 前 面 ) ARRAN > t CIT 


o 


x 


15.2.3 ”从 字符 串 的 开头 或 结尾 或 单词 边界 开始 匹配 (^$ AbAB 
) 


还 有 些 符号 和 特殊 字符 是 用 来 从 字符 串 的 开头 或 结尾 开始 搜索 正则 表达 式 模式 的 。 如 果 想 从 

字符 串 的 开头 开始 匹配 一 个 模式 ， 你 必须 用 脱 字 符号 (^o Rp o Caret) 或 特殊 字符 \A (大 写字 
母 A 前 面 加 上 一 个 反 斜 线 ) 。 后 者 主要 是 为 那些 没有 caret 符 号 的 键盘 使 用 的 ， 比 如 说 国际 键 

盘 。 类 似 ， 美 元 符号 ($) AZAR (ZTA) 匹配 字符 串 的 结尾 的 。 


用 这 些 符号 的 模式 与 我 们 将 在 本 章 讲述 的 其 他 大 多 数 符号 是 不 同 的 ， 因 为 这 些 符号 指定 了 
(匹配 字符 ) 的 位 置 。 在 上 面 的 核心 笔记 里 ， 我 们 曾 说 过 “匹配 "和 “搜索 "之 间 的 区 别 ，“ 匹 

配 ? 是 试图 从 整个 字符 串 的 开头 进行 匹配 ， 而 "搜索 " 则 可 从 一 个 字符 串 的 任意 位 置 开 始 匹 配 。 
正 因为 这 几 个 字符 和 搜索 的 位 置 有 关 ， 所 以 需要 和 搜索 模式 一 起 使 用 。 下 面 是 几 个 "擦边球 "的 
正则 表达 式 搜索 模式 : 


正则 表达 式 模 式 匹配 的 字符 串 


^From 匹配 任何 以 From 开始 的 字符 串 
/bin/tcsh$ 匹配 任何 以 /bin/tcsh 结束 的 字符 串 
^Subject: hi$ 匹配 仅 由 Subject: hi 组 成 的 字符 串 


特别 说 明 ， 如 果 你 想 匹 配 这 两 个 字符 中 的 任何 一 个 (或 全 部 ) ， 就 必须 用 反 斜 线 进行 转 义 。 
例如 ， 如 果 你 想 匹 配 任 何以 美元 符号 ($) 结尾 的 字符 串 ， 一 个 可 行 的 解决 办 法 是 用 正则 表达 
式 模式 “.*$$”。 


特殊 字符 \b and \B 用 来 匹配 单词 边界 。 两 者 之 间 的 区 别 是 ，\b 匹 配 的 模式 是 一 个 单词 边界 ， 就 
是 说 ， 与 之 对 应 的 模式 一 定 在 一 个 单词 的 开头 ， 不 论 这 个 单词 的 前 面 是 有 字符 (该 词 在 一 个 
字符 串 的 中 间 ) ， 还 是 没有 字符 (该 单词 在 一 行 的 起 始 处 ) 。 同 样 地 ，\B 只 匹配 出 现在 一 个 
单词 中 间 的 模式 ( 即 ， 不 在 单词 边界 上 的 字符 ) 。 看 下 面 几 个 例子 : 


正则 表达 式 模 式 匹配 字 的 字符 串 

the 任何 包含 有 "the" 的 字符 串 

\bthe 任何 以 "the" 开 始 的 字符 串 

\bthe\b 仅 匹 配 单词 "the" 

\Bthe 任意 包含 "the" 但 不 以 "the" 开 头 的 单词 


15.2.4 创建 字符 类 (0) 


尽管 句点 可 用 来 匹配 任意 字符 ， 但 有 时 候 你 需要 匹配 某 些 个 特殊 的 字符 。 正 因为 如 此 ， 方 括 
号 (上) 被 发 明 出 来 。 使 用 方 括号 的 正则 表达 式 会 匹配 方 括号 里 的 任何 一 个 字符 。 几 个 例子 如 
"T: 

正则 表达 式 模式 配 的 字符 串 

b[aeiu]t bat, bet, bit, but 

[cer] [23] [dp] fo2] 一 个 包含 4 个 字符 的 字符 中 ， 第 一 个 字符 是 "zw 或 "c"， 后 面 是 "2" 成 "3"， 青 接 下 来 是 "d" 或 "p"， 

最 后 是 "o" 或 "2"， 例 如 : c2do. r3p2. r2d2. c3po 等 . 

关于 正则 表达 式 “[crl[23][dp][o2] "的 一 点 要 说 明 : 如 果 只 让 “r2d2 或 “‘c3po” 成 为 有 效 的 字符 串 ， 
就 需要 限定 更 为 严格 的 正则 表达 式 。 但 因为 方 括 号 只 有 "逻辑 或 ”(“logical OR"). 的 功能 ， 所 
以 用 方 括号 不 能 实现 这 一 限定 要 求 。 唯 一 的 解决 办 法 是 用 管道 符号 (pipe) ， 例 
如 : "r2d2|c3po" ° 


对 仅 有 单个 字符 的 正则 表达 式 ， 使 用 管道 符号 和 方 括号 的 效果 是 等 价 的 。 举 例 来 说 ， 正 则 表 
达 式 “ab”， 只 匹配 以 “a” 开 头 后 面 再 跟 一 个 “b” 的 字符 事 。 如 果 我 们 只 想 要 一 个 字母 的 字符 串 ， 
即 ，“a” 或 者 “b” 中 的 一 个 ， 就 可 以 使 用 正则 表达 式 “[abJ”。 因 为 “a” 和 “b” 是 单个 的 字符 囊 ， 我 们 
也 可 以 用 正则 表达 式 “a|b”。 但 是 ， 如 果 我 们 想 用 模式 匹配 “ab”， 后 面 接着 是 "cd" 的 字符 囊 ， 就 
不 能 用 方 括号 了 ， 因 为 方 括号 只 适用 于 单个 字符 的 情况 。 这 样 ， 唯 一 的 办 法 是 用 “ablcd”， 这 
和 我 们 刚才 提 到 的 “r2d2|c3po" 的 道理 是 相同 的 。 


15.2.5 指定 范围 (-) 和 和 否定 (^) 


> kk 


方 括号 除 匹配 单个 字符 外 ， 还 可 以 支持 所 指定 的 字符 范围 。 方 括号 里 一 对 符号 中 间 的 连 字符 
(-) 用 来 表示 一 个 字符 的 范围 ， 例 如 A-Z、a-z 或 0-9 分 别 代表 大 写字 母 、 小 写字 母 和 十 进 制 数 
字 。 这 是 一 个 按 字母 顺序 排序 的 范围 ， 所 以 它 不 限于 只 用 在 字母 和 十 进 制 数字 上 。 另 外 ， 如 
果 在 左 方 括号 后 第 一 个 字符 是 上 箭头 符号 (^) ， 就 表示 不 匹配 指定 字符 集 里 的 任意 字符 。 


正则 表达 式 模 式 匹配 的 字符 
z.[0-9] 字符 "z”， 后 面 跟 任意 一 个 字符 ， 然 后 是 一 个 十 进 制 数字 
[r-u][env-y] [us] "r", S. "at ”中 的 从 gt 个 字符 ， ^ TU ER) E ne. "n". "yn, Uu", "xig 
"yw 中 的 任意 一 个 字符 ， 再 后 面 是 字符 "bu" 或 "sw， 
[^aeiou 个 非 元 音字 符 Gh ”为 什么 我 们 说 “ 洪 元 音 ”， 面 不 说 “辅音 字母 ”?) 
[^\t\n] 除 TAB MARRIT LERAAR 
在 使 用 ASCII 字符 集 的 系统 中 ， 上 顺序 值 在 “"” 和 “ay” 之 间 的 任意 一 个 字符 ， 即 ， 
睛 序号 在 34 和 97 之 间 的 某 一 个 字符 ， 


15.2.6 使 用 闭 包 操作 符 (r4: 7?) 实现 多 次 出 现 /重复 匹 
配 


现在 我 们 来 介绍 最 常用 的 正则 表达 式 符号 ， 即 ， 特 殊 符号 “”、“+” 和 “?”， 它们 可 以 用 于 匹配 
字符 串 模 式 出 现 一 次 、 多 次 或 未 出 现 的 情况 。 星 号 或 称 星 号 操作 符 匹 配 它 左 边 那 个 正则 表达 
式 出 现 零 次 或 零 次 以 上 的 情况 (在 计算 机 语言 和 编译 器 原理 里 ， 此 操作 符 被 叫做 Kleene 闭 包 
操作 符 ) 。 加 号 (+) 操作 符 匹 配 它 左边 那个 正则 表达 式 模式 至 少 出 现 一 次 的 情况 ( 它 也 被 称 
为 正 闭 包 操作 符 ) ， 而 问号 操作 符 (2) 匹配 它 左 边 那 个 正则 表达 式 模式 出 现 零 次 或 一 次 的 
情况 。 


还 有 花 括 号 操作 符 (P ， 花 括号 里 可 以 是 单个 的 值 ， 也 可 以 是 由 各 号 分 开 的 一 对 值 。 如 果 是 
一 个 值 ， 如 ，{N}， 则 表示 匹配 N 次 出 现 ; 如 果 是 一 对 值 ， 即 ，{M, N}, 就 表示 匹配 M 次 到 N 次 出 
现 。 可 以 在 这 些 符号 前 用 反 斜 线 进 行 转 义 ， 使 它们 失去 特殊 作用 ， 即 ，“*asti "将 匹配 星 号 本 身 


A 


Xo 


在 上 表 中 ， 我 们 注意 到 问号 出 现 了 不 只 一 次 〔 被 重 载 ) ， 问 号 有 两 种 含义 : 1， 单独 使 用 时 表 
示 匹 配 出 现 零 次 或 一 次 的 情况 ，2 ' 紧 跟 在 表示 重复 的 元 字 待 后 面 时 ， 表 示 要 求 搜索 引擎 匹配 
的 字符 串 越 短 越 好 ， 例 如 (+2) 。 

前 面 提 到 " 越 短 越 好 "是 什么 意思 呢 ? 当 使 用 了 表示 重复 的 元 字符 (*+? {mn}) 时 ， 正 则 表达 式 
引擎 在 匹配 模式 时 会 尽量 "吸收 "更 多 的 字符 。 这 就 叫做 "贪心 "。 问号 告诉 正则 表达 式 引擎 尽 可 
能 地 偷懒 ， 要 求 当 前 匹配 消耗 的 字符 越 少 越 好 ， 留 下 尽 可 能 多 的 字符 给 后 面 的 模式 (如 果 存 
在 ) 。 在 本 章 末 尼 ， 我 们 举 一 个 有 代表 性 的 例子 来 说 明 必须 使 用 非 贪心 模式 的 情况 。 


现在 ， 让 我 们 接着 来 看 一 些 使 用 闭 包 操作 符 的 例子 。 


正则 表达 式 模式 匹配 的 字符 


(dn]ot? Parwo", Ee Mo", WERE At", Udo, no 
dot. not 
0?(1-9] 1 一 9 中 的 任意 一 位 数字 ， 前 面 可 能 还 有 一 个 "0" 。 例 如 ， 可 以 把 它 看 成 
月 九 月 的 数字 表示 形式 ， 不 管 是 一 位 数字 还 基 两 位 数字 的 表示 形式 ， 
[0-9] {15,16} 15 或 16 位 数字 表示 ， 例 如 ; 信用 卡号 码 
«/?[^»]*» 匹配 所 有 合法 〈 和 无 效 的 》 HTML 标签 的 字符 串 
[KQRBNP] {a-h} (1-8] - [a-h] [1-8] E KRE” ioo. ARARE AAU COURS. F 


包括 吃 子 和 将 军 》。 gU, "K". "Q". "R", "B", "NR pE 
后 面 加 上 两 个 用 连 字符 连 在 一 起 的 "al "到 "h8" 之 和 癌 的 棋盘 坐标 。 前 
面 的 编号 表示 从 亏 里 开始 走 棋 ， 后 面 的 编号 代表 走 到 哪个 位 置 ( 棋 格 》 E. 


15.2.7 ”特殊 字符 表示 、 字 符 集 


我 们 还 提 到 有 一 些 特殊 字符 可 以 用 来 代表 字符 集合 。 例 如 ， 你 可 以 不 使 用 “0-9” 这 个 范围 表示 
十 进 制 数字 ， 而 改 用 简写 d" 表 示 。 另 一 个 特殊 的 字符 Ww" 可 用 来 表示 整个 字符 数字 的 字符 
集 ， 即 相当 于 “A-Za-z0-9 “的 简写 形式 ， 特 殊 字符 As" 代 表 空 白字 符 。 这 些 特殊 字符 的 大 写 形 
式 表示 不 匹配 ， 比 如 ，AD" 表 示 非 十 进 制 数字 的 字符 (等 价 于 “0-9") ， 等 等 。 我 们 来 看 几 个 运 
用 这 些 简写 形式 的 稍 复杂 的 例子 。 


正则 表达 式 模式 匹配 的 字符 串 

\wt-\d+ 个 由 字母 或 数字 组 成 的 字符 事 和 至 少 一 个 数字 ， 两 部 分 中 间 由 连 字符 连接 

[A-Za-z] \w* 第 一 个 字符 是 字母 ， 其 余 字 符 〈 如 果 存 在 的 话 》， 是 字母 或 数字 〈 它 几乎 等 价 于 
Python H aped c 见 参 考 练习 ) ) 

Ad(3) -Ad( 3) -Ad(4) (EBD 电话 号 码 ， 前 面 适 区 号 前 级 ， 例 如 800-555-1212 

Vw Nw. com 简单 的 XXXeYYY .com 格式 的 电子 邮件 地 址 


15.2.8 用 圆 括 号 (()) 组 建 组 


现在 ， 或 许 我 们 可 以 匹配 一 个 字符 串 和 丢弃 那些 不 匹配 的 字符 串 了 ， 但 有 时 候 ， 我 们 也 许 对 
匹配 的 数据 本 身 更 有 兴趣 。 我 们 不 仅 想 知道 是 否 整 个 字符 囊 匹 配 我 们 的 条 件 (正则 表达 
A) ， 还 想 在 匹配 成 功 时 取出 茶 个 特定 的 字符 串 或 子 字 符 串 。 要 达到 这 个 目的 ， 只 需要 给 正 
则 表达 式 的 两 边 加 上 一 对 圆 括 号 。 


一 对 圆 括号 (()) 和 正则 表达 式 一 起 使 用 时 可 以 实现 以 下 任意 一 个 (或 两 个 ) 功能 : 
e 对 正则 表达 式 进 行 分 组 
e 匹配 子 组 


有 时 你 需要 对 正则 表达 式 进行 分 组 ， 其 中 一 个 很 好 的 例子 就 是 ， 你 要 用 两 个 不 同 的 正则 表达 
式 去 比较 一 个 字符 串 。 另 一 个 理由 是 为 整个 正则 表达 式 添加 一 个 重复 操作 符 〈 即 不 是 仅 重复 
单个 字符 或 单一 字符 集 ) 。 


使 用 国 括 号 的 一 个 额外 好 处 就 是 匹配 的 子囊 会 被 保存 到 一 个 子 组 ， 便 于 今后 使 用 。 这 些 子 组 
可 以 在 同一 次 匹配 或 搜索 中 被 重复 调用 ， 或 被 提取 出 来 做 进一步 处 理 。 在 15.3.9 小 节 的 结尾 你 
会 读 到 一 些 提取 子 组 的 例子 。 


为 什么 需要 使 用 子 组 匹配 呢 ? 主要 是 有 时 除了 进行 匹配 操作 外 ， 你 还 想 要 提取 匹配 模式 的 内 
容 。 如 果 想 知道 在 成 功 的 匹配 中 ， 是 哪些 字符 串 匹 配 了 我 们 的 正则 表达 式 模式 。 例 如 ， 我 们 
想 用 正则 表达 式 w+-\d+” 匹 配 一 些 内 容 ， 但 又 想 把 第 一 部 分 的 字符 和 第 二 部 分 的 数字 分 别 保 
存 ， 该 怎么 做 呢 ? 


如 果 我 们 给 两 个 子 模式 都 加 上 圆 括号 ， 即 ， 将 它 写 成 <(\Ww+) - Ode) ”， 那 我 们 就 可 以 对 这 
两 个 匹配 的 子 组 分 别 进行 访问 了 。 当 然 你 也 可 以 使 用 其 他 方法 达到 同样 目的 ， 比 如 ， 先 写 一 
段 代码 判断 是 否 找 到 匹配 的 对 象 ， 然 后 再 执行 另 一 个 程式 (也 必须 再 写 一 段 代码 ) 来 解析 整 
个 匹配 的 部 分 ， 从 中 提取 出 两 个 部 分 来 。 然 而 相 比 之 下 把 正则 表达 式 划 分 为 子 组 是 更 好 的 实 
现 办 法 ， 因 为 Python 已 经 在 re 模块 里 支持 此 功能 ， 那 为 什么 不 让 Python 来 做 这 项 工作 ， 而 非 
要 重复 发 明 一 个 轮子 呢 ? 


正则 表达 式 栅 式 匹配 的 字符 串 
\d+(\. \d*)? ERARA, W, 任意 个 十 进 制 数字 ， 后 面 跟 一 个 可 这 
rpm A^ rc mE x PAL Ea "0 4 
M 名 字 和 姓氏 ， 对 名 字 的 限制 ( 首 学 母 } pu 《如 森 存 在 ) 
全 多 前 有 可 选 的 ir" ts”、 或 
VIT frzme, fert wl mb. AST. 


15.3 ”正则 表达 式 和 Python 语言 


既然 我 们 已 知道 了 有 关 正 则 表达 式 本 身 的 所 有 知识 ， 那 让 我 们 来 详细 研究 当前 Python 的 默认 

正则 表达 式 模块 re 模块 吧 。re 模 块 在 Pythonl.5 版 本 被 引入 。 如 果 你 正在 使 用 Python 的 早期 版 

本 ， 你 将 只 能 使 用 已 过 时 的 regex、regsub 模 块 。 这 些 模块 具有 Emacs 风格 ， 功 能 不 丰富 ， 而 
且 与 现在 的 re 模块 也 不 兼容 。regex 和 regsub 这 两 个 模块 已 在 Python 2.5 版 本 时 被 移 除 了 ， 在 

Python2.5 及 其 后 续 版 本 ， 引 入 这 两 个 模块 中 的 任何 一 个 将 会 引发 Import Error 3€ ° 


但 正则 表达 式 本 身 是 不 变 的 ， 所 以 本 小 节 中 的 大 多 数 基 本 概念 仍然 适用 于 日 版 的 regex 和 reg- 

sub 模 块 。 与 日 模块 形成 鲜明 对 比 的 是 ， 新 的 re 模块 支持 功能 更 强大 、 更 通用 的 Perl 风 格 (E 

体 说 是 Perl5 的 风格 ) 的 正则 表达 式 ， 允 许多 线程 共享 同一 经 过 编译 的 正则 表达 式 对 象 ， 同 时 

它 还 支持 对 正则 表达 式 分 组 进行 命名 和 按 名 字 调 用 。 另 外 ， 有 一 个 名 叫 reconvert 的 转换 模块 

是 帮助 开发 者 从 regex/regsub 模 块 迁 移 到 re 模块 的 。 但 请 注意 ， 正 则 表达 式 有 不 同 的 风格 ， 我 
们 主要 研究 当今 Python 语 言 中 使 用 的 正则 表达 式 。 


re 引擎 已 在 Python1.6 版 本 中 被 重 写 ， 改 进 了 它 的 性 能 并 添加 了 对 Unicode 的 支持 。 接 口 并 没 
有 改变 ， 因 此 模块 的 名 字 也 保持 不 变 。 新 的 re 引擎 ， 内 部 被 叫做 sre， 替 代 了 1.5 版 本 中 内 部 名 
为 pcre 的 re 引擎 。 


15.3.1 re 模块 : 核心 函数 和 方法 


表 15.2 列 出 了 re 模块 最 常用 的 函数 和 方法 。 其 中 有 很 多 函数 也 与 已 编译 的 正则 表达 式 对 象 
(regex objects) 和 正则 “匹配 对 象 ”( match objects) 的 方法 同名 并 且 具 有 相同 功能 。 


在 本 小 节 ， 我 们 来 看 两 个 主要 的 函数 /方法 match() 和 search()， 以 及 compile() 函 数 。 在 下 一 节 
我 们 还 会 再 介绍 更 多 ， 但 如 果 想 进一步 了 解 我 们 涉及 或 没有 涉及 的 更 多 相关 信息 ， 我 们 建议 
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b. Python 2.2 新 增 ，2.4 中 增加 标识 参数 


核心 笔记 : RE 编译 〈 何 时 应 该 使 用 compile 函 数 ? ) 


在 第 14 章 ， 我 们 曾 说 过 Python 的 代码 最 终 会 被 编译 为 字 节 码 ， 然 后 才 被 解释 器 执行 。 我 们 特 
别提 到 用 调用 eval() 或 exec() 调 用 一 个 代码 对 象 而 不 是 一 个 字符 串 ， 在 性 能 上 会 有 明显 的 提 
升 ， 这 是 因为 对 前 者 来 说 ， 编 译 过 程 不 必 执 行 。 换 名 话说 ， 使 用 预 编译 代码 对 象 要 比 使 用 字 
符 串 快 ， 因 为 解释 器 在 执行 字符 串 形 式 的 代码 前 必须 先 把 它 编 译 成 代码 对 象 。 


这 个 概念 也 适用 于 正则 表达 式 ， 在 模式 匹配 之 前 ， 正 则 表达 式 模式 必须 先 被 编译 成 regex 对 
象 。 由 于 正则 表达 式 在 执行 过 程 中 被 多 次 用 于 比较 ， 我 们 强烈 建议 先 对 它 做 预 编译 ， 而 且 ， 
既然 正则 表达 式 的 编译 是 必须 的 ， 那 使 用 么 预先 编译 来 提升 执行 性 能 无 疑 是 明智 之 举 。 
re.compile() 就 是 用 来 提供 此 功能 的 。 


其 实 模块 函 数 会 对 已 编译 对 象 进 行 缓 存 ， 所 以 不 是 所 有 使 用 相同 正则 表达 式 模 式 的 search() 
和 match() 都 需要 编译 。 即 使 这 样 ， 你 仍然 节省 了 查询 缓存 ， 和 用 相同 的 字符 串 反复 调用 函数 
的 性 能 开销 。 在 Python1.5.2 版 本 里 ， 缓 存 区 可 以 容纳 20 个 已 编译 的 正则 表达 式 对 象 ， 而 在 1.6 
版 本 里 ， 由 于 另外 添加 了 对 Unicode 的 支持 ， 编 译 引 擎 的 速度 变 慢 了 一 些 ， 所 以 缓存 区 被 扩展 
到 可 以 容纳 100 个 已 编译 的 regex 对 象 。 


15.3.2. ”使 用 compile() 编 译 正 则 表达 式 


我 们 稍 后 要 讲 到 的 大 多 数 re 模块 函数 都 可 以 作为 regex 对 象 的 方法 。 注 意 ， 尽 管 我 们 建议 预 纺 
译 ， 但 它 并 不 是 必需 的 。 如 果 你 需要 编译 ， 就 用 方法 ， 如 果 不 需 要 ， 可 以 使 用 函数 。 幸 运 的 
是 无 论 你 用 哪 种 方式 -函数 还 是 方法 ， 名 字 都 是 相同 的 。 (也 许 你 曾 对 此 好 奇 ， 这 正 是 模块 函 
数 和 方法 完全 一 样 的 原因 ， 例 如 search()、match() 等 ) 在 后 面 的 例子 里 ， 我 们 将 用 字符 串 ， 

这 样 可 以 省 去 一 个 小 步骤 。 我 们 仍 会 用 到 几 个 预 编 译 代 码 对 象 ， 这 样 你 可 以 知道 它 的 过 程 是 
怎么 回 事 。 


编译 rex 对 象 时 给 出 一 些 可 选 标识 符 ， 可 以 得 到 特殊 的 编译 对 象 。 这 些 对 象 将 允许 不 区 别 大 小 
写 的 匹配 ， 或 使 用 系统 的 本 地 设置 定义 的 字母 表 进 行 匹 配 等 。 详 情 请 参阅 有 关 文 档 。 这 些 标 

识 符 也 可 以 作为 参数 传 给 模块 (AF) 版 本 的 match() 和 search() 进 行 特定 模式 的 匹配 ， 其 中 

一 些 标识 符 已 在 前 面 做 过 简短 介绍 〈 例 如 ，DOTALL,LOCALE) -这 些 标识 符 多 数 用 于 编译 ， 

也 正 因 如 此 它们 可 以 被 传 给 模块 版 本 的 match() 和 search()， 而 match() 和 search() 肯 定 要 对 正 

则 表达 式 模式 编译 一 次 。 如 果 你 想 在 regex 对 象 的 方法 中 使 用 这 些 标识 符 ， 则 必须 在 编译 对 象 
时 传递 这 些 参数 。 


除 下 面 的 方法 外 ，regex 对 象 还 有 一 些 数据 属性 ， 其 中 两 个 是 创建 时 给 定 的 编译 标识 符 和 正则 
表达 式 模式 。 


15.3.8 mst  fegroup() ^ groups() > ;& 


在 处 理 正则 表达 式 时 ， 除 regex 对 象 外 ， 还 有 另 一 种 对 象 类 型 -匹配 对 象 。 这 些 对 象 是 在 
match() 或 search() 被 成 功 调用 之 后 所 返回 的 结果 。 匹 配对 象 有 两 个 主要 方法 : group() 和 
groups() * 


group() 方 法 或 者 返回 所 有 匹配 对 象 或 是 根据 要 求 返回 某 个 特定 子 组 。groups() 则 很 简单 ， 它 
返回 一 个 包含 唯一 或 所 有 子 组 的 元 组 。 如 果 正 则 表达 式 中 没有 子 组 的 话 ，groups() 将 返回 一 个 
空 元 组 ， 而 group() 仍 会 返回 全 部 匹配 对 象 。 


Python 语言 中 的 正则 表达 式 支持 对 匹配 对 象 进 行 命名 的 功能 ， 这 部 分 内 容 超 出 了 本 介绍 性 小 
节 对 正则 表达 式 的 讨论 范围 。 我 们 建议 你 阅读 re 模块 的 文档 ， 里 面 有 我 们 省 略 掉 的 关于 这 些 高 
级 主题 的 详细 内 容 。 


15.3.4 用 match() 匹 配 字符 串 


我 们 先 来 研究 re 模块 的 函数 、 正 则 表达 式 对 象 (regex object) 的 方法 : match() » match() & 

数 尝 试 从 字符 串 的 开头 开始 对 模式 进行 匹配 。 如 果 匹 配 成 功 ， 就 返回 一 个 匹配 对 象 ， 而 如 果 

匹配 失败 了 ， 就 返回 None。 匹 配对 象 的 group() 方 法 可 以 用 来 显示 那个 成 功 的 匹配 。 下 面 是 如 
何 运用 match() (group()) 的 一 个 例子 : 


>>> m = re.match('foo', 'foo') # 模 式 匹 配 字符 串 
>>> if m is not None: # 如 果 成 功 ， 显 示 匹 配 
m.group() 


'foo' 
模式 “foo" 完 全 匹配 字符 串 *foo”。 在 交互 解析 器 中 ， 我 们 能 确定 m 就 是 一 个 匹配 对 象 的 实例 。 


>>> m # 确 定 返回 匹配 对 象 
«re.MatchObject instance at 80ebf48» 


这 是 当 匹 配 失 败 时 的 例子 ， 它 返回 None : 


>>> m = re.match('foo', 'bar') # 模式 不 匹配 字符 串 
>>> if m is not None: m.group() #1 行 的 i£ FE 
EJ ^ . 
DO 


上 面 的 匹配 失败 ， 所 以 m 被 赋值 为 None， 因 为 我 们 写 的 if 语 名 中 没有 什么 行动 ， 所 以 也 没有 什 
么 指令 动作 被 执行 。 在 以 后 的 例子 中 ， 为 了 简洁 ， 在 可 能 的 情况 下 ， 我 们 会 省 去 if 检 查 语句 ， 

但 在 实际 编程 中 ， 最 好 写 上 它 ， 以 防止 出 现 AttributeError 弄 常 (失败 后 返回 None， 此 时 它 是 

没有 group() 属 性 (方法 ) 的 ) 。 


即使 字符 串 比 模式 要 长 ， 匹 配 也 可 能 成 功 ; 只 要 模式 是 从 字符 串 的 开始 进行 匹配 的 。 例 如 ， 
模式 "foo" 在 字符 串 “food on the table" 中 找到 一 个 匹配 ， 因 为 它 是 从 该 字符 串 开 头 进行 匹 配 
的 : 


>>> m = re.match('foo', 'food on the table') # 匹配 成 功 
»»» m.group() 


' foo' 


如 你 看 到 的 ， 尽 管 字 符 串 比 模式 要 长 ， 但 从 字符 串 开 头 有 一 个 成 功 的 匹配 。 子 串 “foo" 是 从 那 
个 较 长 的 字符 串 中 抽取 出 来 的 匹配 部 分 。 


我 们 甚至 可 以 充分 利用 Python 语言 面向 对 象 的 特性 ， 间 接 省 略 中 间 结 果 ， 将 最 终结 果 保 存 到 
一 起 : 


>>> re.match('foo', 'food on the table').group() 


' foo' 


注意 ， 上 面 的 例子 中 ， 如 果 匹 配 失败 ， 会 引发 一 个 AttributeError 异 常 。 


15.3.5 search() 在 一 个 字符 串 中 查找 一 个 模式 〈 搜 索 与 匹配 的 
比较 ) 


其 实 ， 你 要 搜索 的 模式 出 现在 一 个 字符 串 中 间 的 机 率 要 比 出 现在 字符 串 开 头 的 机 率 更 大 一 

些 。 这 正 是 search() 派 上 用 场 的 时 候 。search 和 match 的 工作 方式 一 样 ， 不 同 之 处 在 于 search 
会 检查 参数 字符 串 任意 位 置 的 地 方 给 定 正则 表达 式 模式 的 匹配 情况 。 如 果 搜 索 到 成 功 的 匹 
配 ， 会 返回 一 个 匹配 对 象 ， 否 则 返回 None e 


现在 我 们 来 举例 说 明 match() 和 search() 之 间 的 区 别 。 让 我 们 举 一 个 对 长 字符 串 进 行 匹 配 的 例 
子 。 这 次 ， 我 们 用 字符 串 "foo" 去 匹配 “Seafood”: 
>>> m = re.match('foo', 'seafood') # 匹 配 失 败 


>>> if m is not None: m.grourp() 


>>> 


如 你 所 见 ， 这 里 没有 匹配 成 功 。match() 尝 试 从 字符 串 起 始 处 进行 匹配 模式 ， 即 ， 模 式 中 
的 中 试 匹配 到 字符 囊 中 首 字母 “Ss” 上 ， 这 样 匹 配 肯 定 是 失败 的 。 但 字符 串 “foo” 确 实 出 现 
在 “seafood” 中 ， 那 我 们 如 何 才能 让 Python 得 出 肯定 的 结果 呢 ?答案 是 用 search() 函 数 。 
search() 搜 索 字 符 串 中 模式 首次 出 现 的 位 置 ， 而 不 是 尝试 《在 起 始 处 ) 匹配 。 严 格 地 说 ， 
search() 是 从 左 到 右 进行 搜索 。 

>>> m = re.search('foc', 'seafood') # 改 用 search() 


>>> if m is not None: m.group() 


! foo" # 用 search 成 功 匹 配 ， 用 match 匹配 失败 

>>> 
在 本 小 节 以 后 的 内 容 里 ， 将 通过 大 量 的 例子 展示 如 何在 Python 语言 中 运用 正则 表达 式 ， 我 们 
会 用 到 regex 对 象 的 方法 match() 和 search()， 匹 配对 象 的 方法 group()、groups() 和 正则 表达 式 
语法 中 的 绝 大 多 数 特殊 字符 和 符号 。 


15.3.6 ”匹配 多 个 字符 囊 (|) 


在 15.2 小 节 里 ， 我 们 在 正则 表达 式 “bat|bet|bit* 中 使 用 了 管道 符号 。 下 面 ， 我 们 把 这 个 正则 表 
达 式 用 到 Python 的 代码 里 : 


Python 核心 编程 第 二 版 


>>> bt = 'bat|bet|bit' # 正 则 表达 式 模式 : bat, bet, bit 
>>> m = re.match(bt, 'bat') #'bat， 是 匹配 的 


>>> if m is not None: m.group() 
'bat' 
»»» m - re.match(bt, 'blt') # 没 有 匹配 "blt ' 的 模式 


>>> if m is not None: m.group() 


>>> m = re.match(bt, 'He bit me!') CRUCRET T R 
»»» if m is not None: m.group() 


>>> m = re.search(bt, 'He bit me!') # 搜 索 到 'bit* 
>>> if m is not None: m.groupt{) 


'bit' 


15.3.7 匹配 任意 单个 字符 〈.) 


以 下 的 例子 中 ， 我 们 将 说 明和 句点 是 不 能 匹配 换行 符 或 非 字 符 ( 即 空 字符 串 ) 的 : 
>>> anyend = '.end' 
»»» m = re.match(anyend, 'bend') JAULA 'b' 


>>> if m is not None: m.group() 


'bend' 
>>> m = re.match(anyend, 'end') # 没 有 字符 匹配 
»»» if m is not None: m.group() 


>>> m = re.match(anyend, 'Anend') # 匹配 字符 〈\n 除外 ) 
>>> if m is not None: m.group() 


>>> m = re.search('.end', 'The end.') # 匹 配 ! ' 
>>> if m is not None: m.group() 


' end' 


TF da 85 6] T ACOR AUR — SEEGA (小数 点 ) GEMAN’ JEGEDAGAR AP > MARERA 
它 进 行 转 义 ， 使 名 点 失去 它 的 特殊 意义 : 


»»» patt314 = '3.14' # 正 则 表达 式 名 点 
>>> pi patt = '3\.14' # 浮 点 〈 小 数 点 ) 
>>> m = re.match(pi patt, '3.14') # 完 全 匹配 


»»» if m is not None: m.group() 


$153 正则 表达 式 681 


ec per d du 

>>> m = re.matchí(patt314, '3014') # 句 点 匹配 'o' 
>>> if m is not None: m.group() 

' 3014" 

>>> m = re.match(patt314, '3.14') # 句 点 匹配 '.' 


>>> if m is not None: m.group() 


"a4" 


15.3.8 ”创建 字符 集合 (p 


前 面 我 们 曾 讨论 过 “[cr][23][dp][o2J" 和 “r2d2|c3po” 是 不 同 的 。 从 下 面 的 例子 中 ， 可 以 看 
出 “r2d2|c3po”" 与 “[cr][23][dp][o2]" 相 比 有 更 加 严格 的 限制 : 


>>> m = re.match(' [cr] [23] [dp] (o02]', 'c3po') RULRE' c3po' 


»»» if m is not None: m.group() 


'c3po' 
>>> m = re.match('[cr] [23] [dp] [o2] ', 'c2do') HU ' c2do" 


>>> if m is not None: m.group() 


'c2do' 
>>> m = re.match('r2d2|c3po', 'c2do') # 不 匹配 'c2do' 


>>> if m is not None: m.group() 


>>> m = re.match('r2d2|c3po', 'r2d2') # 匹 配 'r2d2" 


>>> if m is not None: m.group() 
'r2d2' 
15.3.9 重复 、 特 殊 字符 和 子 组 


正则 表达 式 中 最 常见 的 情况 包括 特殊 字符 的 使 用 ， 正则 表达 式 模式 的 重复 出 现 ， 以 及 使 用 辆 
括号 对 匹配 模式 的 各 部 分 进行 分 组 和 提取 操作 。 我 们 曾 看 到 过 一 个 关于 简单 电子 邮件 地 址 的 
正则 表达 式 (“w+@\Ww+t.com”) 或 许 我 们 想 要 匹配 的 邮件 地 址 比 这 个 正则 表达 式 的 允许 的 要 
多 。 比 如 ， 为 了 在 域名 前 添加 主机 名 称 支持 ， 即 ， 支 持 “WWw.XXX.com”， 而 不 只 是 允 

许 “XXx.com"” 做 整个 域名 ， 我 们 就 必须 修改 现 有 的 正则 表达 式 。 为 了 表示 主机 名 是 可 选 的 ， 我 
们 要 写 一 个 模式 匹配 主机 名 (后面 跟 一 个 名 点) ， 然 后 用 问号 “? ”表示 此 模式 可 出 现 0 次 或 1 


次 ， 表 示 此 部 分 是 可 选 的 ， 再 把 这 个 可 选 的 正则 表达 式 插 入 到 我 们 前 面 的 那个 正则 表达 式 中 
去 :w+@ (\wt.) ?WW+.com”"。 从 下 面 的 例子 中 可 以 看 出 ， 这 个 表达 式 容 许 “.com" 前 面 有 一 
个 或 两 个 名 字 : 


>>> patt = 'Ww*Q (Nw*tN.)?Nw*N.com' 

>>> re.match (patt, 'nobodyG8xxx.com').group() 
'nobody@xxx.com' 

>>> re.match (patt, 'nobody@www.xxx.com').group () 


'nobodyQGwww.xxx.com' 


接 下 来 ， 我 们 用 以 下 模式 进一步 扩展 我 们 的 例子 ， 允 许 任意 数量 的 子 域名 存在 。 请 特别 注意 
细节 的 变化 ， 将 ? Pw) (\wt.) w*.com": 

>>> patt = 'Nw*&Q(Nw*N.) *Nw*N.com' 

>>> re.match(patt, 'nobody@www.Xxxx.yyy.zzz.com').group () 


'nobodyêwww.Xxxx.yyy.zzz.com' 
但 我 们 必须 要 说 明 的 是 仅 用 字母 或 数字 组 成 的 字符 不 能 满足 邮件 地 址 中 可 能 出 现 的 各 种 字 
符 。 上 述 正 则 表达 式 不 匹配 如 “XXX-yyy.com" 这 样 的 域名 或 其 他 带 有 非 单 词 字符 (如 AW” 等 ) 
的 域名 。 
前 面 ， 我 们 曾 讨 论 过 用 括号 匹配 并 保存 子 组 做 进一步 处 理 的 好 处 ， 这 样 做 比 在 确定 正则 表达 
式 匹 配 后 ， 再 单 写 一 个 子 程序 来 解析 一 个 字符 囊 要 好 。 我 们 还 特别 提 到 用 来 匹配 以 “-" 分 隔 的 
字母 或 数字 组 成 的 字符 囊 和 数字 串 的 正则 表达 式 \WwW+-\d+”， 以 及 如 何 通过 对 此 正则 表达 式 划 
分 子 组 以 构建 一 个 新 的 正则 表达 式 ，”(\W+) -(\d+) "来 完成 任务 ， 下 面 是 旧版 正则 表达 式 
的 执行 情况 : 


>>> m = re.match('\w\w\w-\d\d\d', 'abc-123') 


>>> if m is not None: m.group() 


'abc-123' 
>>> m = re.match('NwNwNw-NdNdNMd', 'abc-xyz') 


»»» if m is not None: m.group() 


>>> 


上 面 的 代码 中 ， 一 个 正则 表达 式 被 用 来 匹配 由 三 个 字母 或 数字 组 成 的 字符 串 ， 再 接着 三 个 数 
字 的 字符 串 。 这 个 正则 表达 式 匹 配 *abc-123”， 但 不 匹配 “abc-xyz”。 我 们 现在 来 修改 正则 表达 
式 ， 使 它 能 分 别提 取 和 包含 字母 或 数字 的 部 分 和 仅 含 数字 的 部 分 。 请 注意 我 们 是 如 何 用 group() 
方法 访问 每 个 子 组 以 及 用 groups() 方 法 获取 一 个 包含 所 有 匹配 子 组 的 元 组 的 : 


Ek 
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>>> m = re.match(' (NWNwNw) - (NdNdNd)', 'abc-123') 


>>> m.group() # 所 有 匹配 部 分 
'abc-123' 

>>> m.group(1) # 匹配 的 子 组 1 
'abc' 

>>> m.group (2) # 匹 配 的 子 组 2 
a ra fia 

>>> m.groups () # 所 有 匹配 子 组 


('*aebo', '123') 


如 你 所 见 ，group() 通 常用 来 显示 所 有 匹配 部 分 ， 也 可 用 来 获取 个 别 匹配 的 子 组 。 我 们 可 用 
groups() 方 法 获得 一 个 包含 所 有 匹配 子 组 的 元 组 。 


下 面 这 个 简单 的 例子 通过 子 组 的 不 同 排列 组 合 ， 帮 助 我 们 理解 得 更 透彻 : 


>>> m = re.match('ab', 'ab"') # 无 子 组 

»»» m.group() # 完全 匹配 
'ab' 

>>> m.groups () # 所 有 匹配 的 子 组 
() 

>>> 

»»» m = re.match('(ab)', 'ab') # 一 个 子 组 

»»» m.group() # 所 有 匹配 'ab' 
' ab' 

»»» m.group(1) # 匹配 的 子 组 1 
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' ab' 

>>> m.groups() # 所 有 匹配 子 组 
('ab') 

>>> 

>>> m = re.match('(a)(b)', 'ab')  # 两 个 子 组 

>>> m.group() # 完全 匹配 

' ab" 

»»» m.group (1) # 匹配 的 子 组 1 

tät 

>>> m.group (2) # 匹配 的 子 组 2 

'p' 

>>> m.groups () # 所 有 匹配 子 组 的 元 组 
(w^ s 

>>> 

>>> m = re.match('(a(b))', 'ab')  # 了 两 个 子 组 

>>> m.group() # 所 有 匹配 部 分 

'ab' 

>>> m.group (1) # 匹 配 的 子 组 1 

' ab" 

>>> m.group (2) # 匹配 的 子 组 2 

'p 

>>> m.groups() # 所 有 匹配 的 子 组 的 元 组 
('ab', 'b') 


15.3.10 ”从 字符 串 的 开头 或 结尾 匹配 及 在 单词 边界 上 的 匹配 


下 面 的 例子 强调 了 锚 点 性 正则 表达 式 操作 符 。 这 些 锚 点 性 正则 表达 式 操作 符 主要 被 用 于 搜索 
而 不 是 匹配 ， 因 为 match() 总 是 从 字符 串 的 开头 进行 匹配 的 。 
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>>> m = re.search('^The', 'The end.') # 匹 配 


22» if m is not None: m.group() 
'The' 
>>> m = re.search('^The', 'end. The") # 不 在 开头 


>>> if m is not None: m.group() 


>>> m = re.search(r'Mothe', 'bite the dog') # 在 词 边 界 
>>> if m is not None: m.group() 

'the' 

>>> m = re.search(r'Mothe', 'bitethe dog') # 无 边界 
>>> if m is not None: m.group() 


>>> m = re.search(r'MBthe', 'bitethe dog') # 无 边界 


>>> if m is not None: m.group() 

'the' 
你 可 能 在 这 里 注意 到 了 原始 字符 串 〈raw strings) 的 出 现 。 在 本 章 末 尾 的 核心 笔记 中 ， 有 关于 
它 的 说 明 。 通 常 ， 在 正则 表达 式 中 使 用 原始 字符 串 是 个 好 主意 。 


你 还 应 该 了 解 另 外 四 个 re 模块 函数 和 regex 对 象 方法 : findall() ` sub() ` subn()fesplit() 。 


15.3.11 用 findall() 找 到 每 个 出 现 的 匹配 部 分 


findall() 自 Python 1.5.2 版 本 被 引入 。 它 用 于 非 重 司 地 搜索 某 字符 串 中 一 个 正则 表达 式 模式 出 现 
的 情况 。findall() 和 search() 相 似 之 处 在 于 二 者 都 执行 字符 串 搜索 ， 但 findall() 和 match() 与 
search() 不 同 之 处 是 ，findall() 总 返回 一 个 列表 。 如 果 findall() 没 有 找到 匹配 的 部 分 ， 会 返回 空 
列表 ; 如 果 成 功 找到 匹配 部 分 ， 则 返回 所 有 匹配 部 分 的 列表 ( 按 从 左 到 右 出 现 的 顺序 排 
A) 。 


2»» re.findall('car', 'car') 

Loa 

>>> re.findall('car', 'scary') 

['car"'] 

>>> re.findall('car', 'carry the barcardi to the car') 


['car'. 'car',; 'car*]) 


包含 子 组 的 搜索 会 返回 更 复杂 的 一 个 列表 ， 这 样 做 是 有 意义 的 ， 因 为 子 组 是 允许 你 从 单个 正 
则 表达 式 中 抽取 特定 模式 的 一 种 机 制 ， 比 如 ， 匹 配 一 个 完整 电话 号 码 中 的 一 部 分 (例如 区 
号 ) ， 或 完整 电子 邮件 地 址 的 一 部 分 (例如 登录 名 ) 。 


正则 表达 式 仅 有 一 个 子 组 时 ，findall() 返 回 子 组 匹配 的 字符 串 组 成 的 列表 ; 如 果 表 达 式 有 多 个 
子 组 ， 返 回 的 结果 是 一 个 元 组 的 列表 ， 人 ， 像 这 样 的 
元 组 (每 一 个 成 功 的 匹配 对 应 一 个 元 组 ) 构成 了 返回 列表 中 的 元 素 。 这 些 内 容 初 次 听 到 可 能 
令 人 费解 ， 但 如 果 你 看 看 各 种 例子 ， 就 会 明白 了 。 


15.3.12. 用 sub() (fesubn()) 进行 搜索 和 替换 


有 两 种 函数 /方法 用 于 完成 搜索 和 代替 的 功能 : sub() 和 subn()。 三 者 几乎 是 一 样 的 ， 都 是 将 某 
字符 串 中 所 有 匹配 正则 表达 式 模式 的 部 分 进行 替换 。 用 来 替换 的 部 分 通常 是 一 个 字符 串 ， 但 
也 可 能 是 一 个 函数 ， 该 函数 返回 一 个 用 来 蔡 换 的 字符 串 。subn() 和 sub() 一 样 ， 但 它 还 返回 一 
个 表示 替换 次 数 的 数字 ， 替 换 后 的 字符 串 和 表示 替换 次 数 的 数字 作为 一 个 元 组 的 元 素 返 回 。 


>>> re.sub('X', 'Mr. Smith', 'attn: X\n\nDear X, \n') 
'attn: Mr. Smith\012\012Dear Mr. Smith, \012' 
>>> 


>>> re.subn('X', 'Mr. Smith', 'attn: XWMnMnDear X,Mn') 
('attn: Mr. SmithM012N012Dear Mr. Smith,*012', 2) 

>>> 

>>> print re.sub('X', 'Mr. Smith', 'attn: X\n\nDear X,\n') 
attn: Mr. Smith 


Dear Mr. Smith, 


>>> re.sub('[ae]', 'X', 'abcdef') 
'Xbcdxf' 

»»» re.subn('[ae]', 'X', 'abcdef') 
(*Abocaxf', 2) 


15.3.13 ”用 split() 分 割 (分 隔 模 式 ) 


re 模块 和 正则 表达 式 对 象 的 方法 split() 与 字符 串 的 split() 方 法 相似 ， 前 者 是 根据 正则 表达 式 模式 
分 隔 字符 串 ， 后 者 是 根据 固定 的 字符 串 分 割 ， 因 此 与 后 者 相 比 ， 显 著 提 升 了 字符 分 割 的 能 

力 。 如 果 你 不 想 在 每 个 模式 匹配 的 地 方 都 分 割 字 符 串 ， 你 可 以 通过 设 定 一 个 值 参数 (ER) 
来 指定 分 割 的 最 大 次 数 。 

如 果 分 隔 符 没有 使 用 由 特殊 符号 表示 的 正则 表达 式 来 匹配 多 个 模式 ， 那 re.split() 和 string.split() 
的 执行 过 程 是 一 样 的 ， 见 以 下 的 例子 (在 每 一 个 冒号 处 分 隔 ) 


2 


['AaErIt. "EE, FSET] 


但 运用 正则 表达 式 后 ， 我 们 会 发 现 re.split() 成 了 一 个 功能 更 强大 的 工具 。 比 如 ，Unix 系 统 下 
who 命 令 输出 所 有 已 登录 系统 的 用 户 的 信息 : 


$ who 

wesc console Jun 20 20:33 

wesc pts/9 Jun 22 01:38 (192.168.0.6) 
wesc pts/1 Jun 20 20:33 (:0.0) 
wesc pts/2 Jun 20 20:33 (:0.0) 
wesc pts/4 Jun 20 20:33 (:0.0) 
wesc pts/3 Jun 20 20:33 (10.0) 
wesc pts/5 Jun 20 20:33 (:0.0) 
wesc pts/6 Jun 20 20:33 (10.0) 
wesc pts/7 Jun 20 20:33 (:0.0) 
wesc pts/8 Jun 20 20:33 (:0.0) 


假如 我 们 想 要 保存 用 户 的 登录 信息 ， 比 如 说 ， 登 录 名 ， 用 户 E 的 电 传 ， 他 们 的 登录 的 时 
间 以 及 登录 地 址 。 用 上 面 的 string.split() 很 难 有 效果 ， 因 为 分 隔 这 些 数 据 的 空白 符号 是 毫 无 规 
律 且 不 确定 的 。 还 有 一 个 问题 ， 就 是 在 登录 时 间 的 数据 中 ， Moe ena 而 
我 们 一 般 想 把 这 些 有 关 时 间 的 数据 排 在 一 起 。 


你 需要 用 某 种 方式 来 描述 这 样 一 种 模式 :“ 在 两 个 或 更 多 个 空格 符 处 进行 分 隔 "”。 正则 表达 式 很 
容易 做 到 这 一 点 。 我 们 能 很 快 写 出 这 个 正则 表达 式 模式 : As\s+”， 含 义 是 至 少 2 个 空白 字符 。 

我 们 来 写 一 个 名 为 rewho.py 的 程序 ， 它 读 入 who 命 2s 出 -假设 已 保存 到 名 为 whodata.txt 的 

文件 中 。 起 初 ， 我 们 写 的 rewho.py 脚 本 看 起 来 像 这 


import re 
f = open('whodata.txt', 'r') 
for eachLine in f.readlines(): 
print re.split('\s\s+', eachLine) 
f.close() 


我 们 现在 执行 who 命 令 ， 将 输出 结果 保存 到 文件 whodata.txt， 然 后 调用 rewho.py 来 看 看 结 
m: 


% who > whodata.txt 

$ rewho.py 

['wesc', 'console', 'Jun 20 20:33*012'] 

['wesc', 'pts/9', 'Jun 22 01:38X011(192.168.0.6) *012'] 
['wesc', 'pts/1', "Jun 20 20:33011(:0.0) *012'] 
['wesc', 'pts/2', 'Jun 20 20:33X011(:0.0) *012'] 
['wesc', 'pts/4', *'Jun 20 20:33X011(:0.0) 012"*] 
['wesc', 'pts/3', ‘Jun 20 20:33*011(:0.0)X012'] 
['wesc', 'pts/5', 'Jun 20 20:33011(:0.0)*012'] 
['wesc', 'pts/6', 'Jun 20 20:33X011(:0.0) *012'] 
['wesc', 'pts/7', 'Jun 20 20:33*011(:0.0) X012'] 
['wesc', 'pts/8', 'Jun 20 20:33*011(:0.0) *012'] 


这 是 不 错 的 尝试 ， 但 还 不 完全 正确 。 首 先 ， 我 们 原先 没有 预料 到 输出 中 会 包含 一 个 TAB 符号 
(ASCINO11) ( 它 看 上 去 像 是 至 少 两 个 空格 ， 对 吗 ? ) 。 而 且 ， 我 们 可 能 对 保存 用 来 结束 每 
行 的 换行 符 NEWLINE (ASCIN012) 也 没什么 兴趣 。 我 们 现在 就 做 些 改 动 来 修正 这 些 问题 ， 
同时 提升 程序 的 整体 质量 。 


首先 ， 我 们 改 从 脚本 里 执行 Who 命令 ， 而 不 是 从 外 部 调用 它 后 将 命令 的 输出 结果 保存 到 文件 
whodata.txt 一 一 这 样 重复 的 步骤 很 快 会 令 人 厌烦 的 。 要 从 我 们 写 的 脚本 里 调用 另 一 个 程序 ， 
可 以 用 os.popen() 命 令 ， 这 个 命令 在 14.5.2 小 节 已 介绍 过 。 尽 管 os.popen() 只 能 在 Unix 系 统 中 
使 用 ， 但 本 例子 意 在 阐明 re.split() 的 用 法 ， 它 可 是 跨 系 统 平台 的 。 


我 们 去 掉 每 行 行 尾 的 换行 符 (NEWLINE) ， 并 添加 检查 单个 TAB 符号 的 模式 ， 把 TAB 作为 
re.split() 的 可 选 分 隔 符 。 例 15.1 是 脚本 rewho.py 的 最 终 版 本 。 


例 15.1 Unix 下 who 命 令 输 出 结果 进行 分 隔 (rewho.py) 


此 脚本 调用 Who 命令 ， 解 析 命 令 的 输出 结果 ， 根 据 不 同 的 空白 符号 分 隔 数据 。 


$£!/usr/bin/env python 


from os import popen 


from re import split 


f = popen('who', 'r') 
for eachLine in f.readlines(): 


1 
2 
3 
4 
5 
6 
j 
8 print split('\s\s+|\t', eachLine.strip()) 
9 


f.close() 


运行 脚本 ， 我 们 得 到 如 下 (正确 ) 结 


Q 


5$ rewho.py 

['wesc', 'console', 'Jun 20 20:33'] 

['wesc', 'pts/9', "Jun 22 01:38', '(192.168.0.6) '] 
[*wesc', 'pts/1', ‘Jun 20 20:33', *'í(:0.0)*] 
['wesc', 'nts/2', 'Jun 20. 20:33', TAGG] 
['wesc', 'pts/4', 'Jun 20 20:33', *'(:9.0)'] 
['wesc', 'pts/3', “Jun 20 20:33', *'1(:20.0)'*] 
['weso', 'opba/5', Toun 20 20:33',. (20.9) *] 
['*wesc', 'ots/6', 'gun 20 20:33',. '"(20.0) *] 
['weésc'; "pts"; tdan 20 20:3377 *[20:0)"*] 
['wesc', 'pts/8', "Jun 20 20:33', '(20.0)"*] 


在 DOS/Windows 环 境 下 ， 用 dir 命 令 代 替 who 命 令 ， 也 可 完成 此 练习 。 


趁 我 们 还 熟悉 ASCII 字 符 ， 我 们 要 提醒 注意 的 是 正则 表达 式 的 特殊 字符 和 特殊 ASCI| 字 符 是 容 
多 混淆 的 。 我 们 可 能 用 mn 来 表示 一 个 ASCII 换 行 字符 ， 但 也 可 以 用 \d 表 示 匹 配 一 个 数字 的 正则 
表达 式 。 如 果 同 一 个 符号 在 ASCll 和 正则 表达 式 中 都 可 以 用 ， 就 容易 出 问题 了 ， 所 以 在 下 页 的 
核心 笔记 中 ， 我 们 推荐 使 用 Python 语言 中 的 “原始 字符 串 " 来 避免 混淆 。 还 要 注 

意 : Aw" 和 AW" 这 两 个 表示 字母 或 数字 的 字符 受 L 或 LOCALE 编 译 标 识 符 的 影响 ， 在 Python 1.6 
至 Python 2.0 以 后 的 版 本 中 受 (U 或 UNICODE 的 ) Unicode 标 识 符 号 影响 。 


核心 笔记 : Python 原始 字符 串 〈raw strings) 的 用 法 


你 可 能 已 经 看 到 前 面 关于 原始 字符 串 用 法 的 一 些 例子 了 。 原 始 字符 串 的 产生 正 是 由 于 有 正则 
表达 式 的 存在 。 原 因 是 ASCII 字 符 和 正则 表达 式 特殊 字符 间 所 产生 的 冲突 。 比 如， 特殊 符 
号 \b” 在 ASCIIl 字 符 中 代表 退 格 键 ， 但 同时 ^\b" 也 是 一 个 正则 表达 式 的 特殊 符号 ， 代 表 “ 匹 配 一 
个 单词 边界 "。 为 了 让 RE 编译 器 把 两 个 字符 Ab” 当 成 你 想 要 表达 的 字符 串 ， 而 不 是 一 个 退 格 
键 ， 你 需要 用 另 一 个 反 针线 对 它 进 行 转 义 ， 即 可 以 这 样 写 : \b”。 


但 这 样 做 会 把 问题 复杂 化 ， 特 别 是 当 你 的 正则 表达 式 字符 串 里 有 很 多 特殊 字符 时 ， 就 更 容易 
令 人 困惑 了 。 在 第 6 章 ， 我 们 曾 介 绍 过 原始 字符 串 ， 它 经 常 被 用 于 简化 正则 表达 式 的 复杂 程 
度 。 事 实 上 ， 很 多 Python 程序 员 在 定义 正则 表达 式 时 都 只 使 用 原始 字符 串 。 下 面 的 例子 用 来 
说 明 退 格 键 \b”" 和 正则 表达 式 \b”( 包含 或 不 包含 原始 字符 囊 ) 之 间 的 区 别 : 


>>> m = re.match('Moblow', 'blow') # 退 格 键 , 没有 匹配 


>>> if m is not None: m.group() 


>>> m = re.match('MMbblow', "'blow') # 用 \ 转 义 后 ， 现 在 匹配 了 


>>> if m is not None: m.group() 


'blow' 
>>> m = re.match(r'Mbblow', "'blow') # 改 用 原始 字符 串 


»»» if m is not None: m.group() 
'blow' 


你 可 能 注意 到 我 们 在 正则 表达 式 里 使 用 Ad”， 没 用 原始 字符 串 ， 也 没 出 现 什 么 问题 。 那 是 因为 
ASCll 里 没有 对 应 的 特殊 字符 ， 所 以 正则 表达 式 编译 器 能 够 知道 你 指 的 是 一 个 十 进 制 数字 。 


15.4 正则 表达 式 示 例 


现在 我 们 来 通读 一 个 详细 完整 的 例子 ， 它 展示 了 用 正则 表达 式 处 理 字 符 串 的 不 同 办 法 。 第 一 
步 : 拿 出 一 段 代码 用 来 生成 随机 数据 ， 生 成 的 数据 用 于 以 后 操作 。 例 15.2 中 ， 脚 本 gendata.py 
生成 一 个 数据 集 。 虽 然 程 序 只 是 将 生成 的 字符 串 显 示 到 标准 输出 ， 但 此 输出 结果 也 可 以 重 定 
向 到 一 个 测试 文件 中 。 


例 15.2 ”正则 表达 式 练习 的 数据 生成 代码 (gendata.py) 


为 练习 使 用 正则 表达 式 生成 随机 数据 ， 并 将 产生 的 数据 输出 到 屏幕 。 


1 #!/usr/bin/env python 


3 from random import randint, choice 
5 from string import lowercase 
5 from sys import maxint 


6 from time import ctime 


8 dóms = 'com', 'edu', 'net', 'org', 'gov' ) 
9 


10 for i in range(randint(5, 10)): 


11 dtint = randint(0, maxint-1) # pick date 


12 dtstr = ctime (dtint) # date string 


14 shorter = randint(4, 7) # login shorter 
15 em - '' 

16 for j in range(shorter): & generate login 
17 em *- choice(lowercase) 

18 

19 longer = randint(shorter, 12) # domain longer 
20 dn = '' 

21 for j in range (longer) # create domain 
22 dn += choice (lowercase) 

23 

24 print '$s::$s0$5.55::$d-$d-5$d' (dtstr, em, 
25 dn, choice(doms), dtint, shorter, longer) 


这 个 脚本 生成 3 个 字段 ， 字 段 由 一 对 冒号 ， 或 双 冒 号 分 隔 。 第 一 个 字段 是 一 个 随机 (328) X 


型 ， 被 转换 为 一 个 日 期 〈 见 “核心 笔记 ”) 


。 第 二 个 字段 是 一 个 随机 产生 的 电子 邮件 (E-mail) 


地 址 ， 最 后 一 个 字段 是 由 单个 横 线 (-) 分 隔 的 一 个 整 型 集合 。 
执行 这 段 代 码 ， 我 们 得 到 以 下 输出 (你 得 到 的 输出 肯定 和 本 书 中 的 不 同 ) ， 并 把 数据 保存 到 
本 地 文件 redata.txt 中 : 
Thu Jul 22 19:21:19 2004::izsp8dicqdhytvhv.edu::1090549279-4-11 
jun Jul 13 22:42:11 2008::zqeu8dxaibjgkniy.com::1216014131-4-11 
Sat May 5 16:36:23 1990::fclihwealwdbzpsdg.edu::641950583-6-10 
Thu Feb 15 17:46:04 2007::uzifzfüdpyivihw.gov::1171590364- 6-8 
Thu Jun 26 19:08:59 2036::ugxfugt8jkhuqhs.net::2098145339-7-7 
Tue Apr 10 01:04:45 2012::zkwaq8rpxwmtikse.com::1334045085-5-10 


你 或 许 能 看 出 来 ， 
几 个 正则 表达 式 对 这 些 数据 的 进 
逐 行 解释 

1~ 6 行 


在 这 


这 个 程序 的 输出 数据 适合 用 正则 表达 式 来 处 理 。 在 我 们 逐 
半 行 操作 ， 也 为 本 章 后 面 的 练习 做 好 准备 。 


行 解释 后 ， 会 用 


个 示例 脚本 里 ， 我 们 要 使 用 多 个 模块 。 但 因为 我 们 只 需要 用 到 这 些 模块 中 的 一 两 个 函 


数 ， 所 以 不 必 引 入 整个 模块 ， 只 须 引 入 模块 中 某 些 属性 即 可 。 我 们 用 from-import 而 不 是 import 


正 是 基于 这 个 原因 。 代 码 第 
8 行 


domes 是 一 组 简单 的 包含 
址 。 


10 ~ 12 行 


顶级 域名 的 集合 ， 我 们 将 从 中 随机 挑选 


行 是 Unix 起 始 提示 符 ， 后 面 是 from-import 这 几 行 。 


一 个 来 随机 生成 电子 邮件 地 


每 次 gendata.py 执 行 都 会 产生 5~10 行 的 输出 。 (这 个 脚本 用 函数 random.randint() 生 成 我 们 需 
要 的 所 有 随机 整 型 。) 在 每 个 输出 行 中 ， 我 们 从 整个 可 能 的 范围 (0~2*31-1 即 
[sys.maxint]) 里 ， 随 机 选 一 个 整 型 ， 然 后 把 这 个 整 型 用 time.ctime() 转 换 成 一 个 日 期 。 大 多 数 
安装 Python 的 基于 Unix 系 统 的 计算 机 上 ， 系 统 时 间 是 根据 1970 年 1 月 1 日 零点 即 纪元 
(epoch) 至 今 的 秒 数 来 计算 的 。 如 果 我 们 选择 32 位 整 型 ， 那 系统 日 期 就 代表 从 纪元 
(epoch) 到 纪元 后 2*32 秒 之 间 的 某 个 时 刻 。 





14 ~ 22 行 


我 们 规定 随机 生成 的 邮箱 地 址 中 登录 名 的 长 度 必须 在 4~7 个 字符 。 我 们 随机 选择 4~7 个 小 写字 
母 ， 依 次 将 它们 连结 到 一 个 字符 串 中 。 函 数 random.choice() 的 用 处 就 是 根据 指定 序列 ， 随 机 
返回 该 序列 中 的 一 个 元 素 。 在 这 里 我 们 指定 序列 是 26 个 小 写字 母 ，string.lowercase。 我 们 规 
定 庶 拟 邮 箱 地 址 的 域名 长 度 在 4 一 12 个 字符 ， 但 不 能 短 于 登录 名 的 长 度 。 最 后 ， 我 们 随机 选择 
一 些小 写字 母 ， 依 次 将 它们 连接 起 来 组 成 域名 。 


24 ~ 25 行 


这 是 本 脚本 的 关键 步骤 : 把 随机 数据 组 合 到 一 起 显示 到 输出 行 。 以 日 期 字符 串 开 头 ， 后 面 是 
分 隔 符 ， 然 后 是 随机 生成 的 电子 邮件 地 址 。 这 个 任意 的 电子 邮件 地 址 是 我 们 把 登录 名 ，“@” 符 
号 ， 域 名 和 一 个 随机 选择 的 顶级 域名 连接 到 一 起 组 成 的 。 在 最 后 一 个 双 冒 号 后 面 ， 我 们 还 加 
了 一 个 随机 整 型 字符 串 ， 它 的 前 部 分 是 与 所 选 随机 日 期 对 应 是 整 型 ， 后 面 的 部 分 分 别 是 登录 
名 和 域名 的 长 度 ， 这 几 个 整 型 之 间 由 连 字 符 分 隔 。 


15.4.1 匹配 一 个 字符 串 


在 下 面 的 练习 里 ， 写 出 你 的 正则 表达 式 ， 包 括 宽松 和 限制 性 强 的 两 个 版 本 。 我 们 建议 你 用 前 
面 的 例子 redata.txt (或 你 自己 运行 gendata.py 生 成 的 随机 数据 ) 来 测试 小 程序 里 的 这 些 正则 
表达 式 。 在 做 练习 的 时 候 ， 你 还 会 再 次 用 到 这 些 数据 。 

在 把 正则 表达 式 写 入 到 我 们 的 小 程序 之 前 ， 我 们 先 要 对 它 进行 测试 。 我 们 先 引 入 re 模块 ， 将 
redata.txt 中 的 一 行 数据 赋值 到 一 个 字符 串 变 量 中 。 下 面 的 语句 在 以 下 的 两 个 示例 中 都 是 这 
样 ， 没 有 变化 。 

>>> import re 


>>> data = 'Thu Feb 15 17:46:04 2007::uzifzf8dpyivihw.gov::1171590364-6-8" 


在 第 一 个 例子 中 ， 我 们 将 写 一 个 正则 表达 式 ， 用 它 从 文件 redata.txt 的 每 一 行 中 ( 仅 ) 提取 时 
间 惟 中 的 有 关 星期 的 数据 字段 。 我 们 将 用 到 以 下 这 个 正则 表达 式 : 


"^Mon|^Tue|^Wed|^Thul|^Fril|^Sat|^Sun" 


上 例 要 求 字 符 串 是 以 所 列 出 的 7 个 字符 串 之 一 作为 开头 〈"“ 人 正则 表达 式 操作 符 ) 。 如 果 我 们 想 
把 上 面 的 正则 表达 式 "翻译 "? 过 来 ， 它 的 意思 大 概 是 :CUUPGT BG "Mon: ” “Tue, ”..., "Sat, 
”或 “Sun” 之 一 打头 ” A 


或 者 ， 我 们 可 以 只 用 一 个 "符号 ， 将 日 期 字符 串 归 为 一 组 : 


"^ (Mon | Tue|Wed| Thu| Fri|Sat|Sun)" 


在 这 组 字符 串 集 合 两 边 的 圆 括号 表示 是 只 有 满足 这 些 字符 串 之 一 匹配 才能 成 功 。 这 是 比 我 们 
前 面 看 到 的 那个 没有 圆 括 号 的 正则 表达 式 “ 更 友好 ”。 而且， 使 用 这 个 修改 后 的 正则 表达 式 还 有 
一 个 好 处 ， 能 使 我 们 方便 地 访问 被 匹配 字符 串 的 那个 子 组 : 


>>> patt = '^(Mon|Tue|Wed| Thu| Fri|lSat|Sun)' 


»»» m = re.match(patt, data) 


>>> m.group() # entire match 
"Thu? 

>>> m.group (1) # subgroup 1 
'Thu' 

>>> m.groups() # all subgroups 
('*Ihu',) 


我 们 在 这 个 例子 里 所 看 到 的 功能 似乎 没有 那么 新 鲜 或 与 众 不 同 ， 但 它 对 于 下 面 的 例子 或 是 通 
过 在 正则 表达 式 中 添加 额外 数据 来 处 理 字符 串 匹 配 时 就 很 有 帮助 了 ， 即 使 这 些 字符 并 不 是 你 
感 兴趣 的 字符 串 中 的 某 部 分 。 上 面 的 两 个 正则 表达 式 都 是 限制 性 很 强 的 ， 特 别 要 求 只 含有 某 
些 字符 串 。 但 在 国际 语言 的 系统 环境 中 ， 使 用 各 地 区 本 地 化 时 间 和 缩写 的 情况 下 ， 可 能 就 行 
不 通 了 。 限 制 性 更 宽松 的 正则 表达 式 是 : "Ww(3) e 


这 个 正则 表达 式 只 要 求 字 符 串 以 三 个 由 字符 或 数字 组 成 的 字符 作 开 头 。 要 是 把 它 翻译 成 白 
Eo RÆ? LK carat) 表示 以 ... 开 始 ，“\W" 指 任意 一 个 由 字符 或 数字 组 成 的 字 

符 ，“{3》" 表 示 它 左边 描述 的 正则 表达 式 模式 必须 连续 出 现 三 次 。 注 意 ， 如 果 你 要 对 这 个 正则 表 
AADA’ HAAZ) BP (\W{3}) ": 

>>> patt = '^(\w{3})' 

>>> m = re.match (patt, data) 

>>> if m is not None: m.group() 

"Thu" 

>>> m.group(1) 

“Thu” 


注意 ， 要 是 把 正则 表达 式 写 成 (Ww) {3}” 是 不 正确 的 。 如 果 把 q(3}" 写 在 园 括 号 里 

( OB) ) ， 表 示 匹 配 三 个 连续 的 由 字符 或 数字 组 成 的 字符 ， 再 把 这 三 个 字符 视 为 一 个 
组 。 但 如 果 把 {3} 所 到 圆 括号 的 外 边 ( Ow) {3}) ， 那 现在 它 的 含义 就 变 成 三 个 连续 的 单个 
由 字符 或 数字 组 成 的 字符 : 


»»» patt "P Ow) (57 " 


>>> m = re.match(patt, data) 


>>> if m is not None: m.group() 


“Trua 


>>> m.group(1) 


Vi 

访问 子 组 1 的 数据 时 ， 只 看 到 "u" 是 因为 子 组 1 中 的 数据 被 不 断 地 替换 成 下 一 个 字符 。 也 就 是 
说 ，m.group (1) 开始 的 结果 是 *T"， 然 后 是 中 "， 最 后 又 被 替换 成 "u”。 它 们 是 三 个 独立 (而 
且 重复 ) 的 组 ， 每 个 组 是 由 字符 或 数字 所 组 成 的 字符 ， 而 不 是 由 连续 的 三 个 字符 或 数字 组 成 
的 字符 所 形成 的 单个 组 。 


在 下 一 个 (也 是 最 后 的 ) 例子 中 ， 我 们 将 写 一 个 正则 表达 式 来 提取 文件 redata.txt 中 每 行 末尾 
的 数值 字段 。 


15.4.2 搜索 与 匹配 的 比较 ，“ 贪 禁 ” 匹 配 


在 我 们 写 正 则 表达 式 前 ， 先 明确 这 些 整 型 数据 项 是 在 字符 串 数据 的 末尾 。 这 意味 着 我 们 有 两 
种 选择 : 搜索 (search) 或 匹配 (match) 。 使 用 搜索 更 合适 ， 因 为 我 们 确切 地 知道 要 搜索 的 
数据 是 什么 (三 个 整 型 的 集合 ) ， 它 不 在 字符 串 的 开头 ， 也 不 是 字符 串 的 全 部 内 容 。 如 果 我 
们 用 匹配 (match) 的 方法 ， 就 不 得 不 写 一 个 正则 表达 式 来 匹配 整 行内 容 ， 并 用 子 组 保存 我 们 
感 兴 趣 的 那 部 分 数据 。 为 说 明 它 们 之 间 的 区 别 ， 我 们 先 用 搜索 搜索 ， 再 尝试 用 匹配 来 做 ， 向 
你 证 明 搜 索 搜索 更 适合 。 


因为 我 们 要 搜索 的 是 三 个 由 连 字符 号 (-) 分 隔 的 整 型 集 ， 所 以 我 们 写 出 如 下 正则 表达 

式 : d+-\d+-\d+”。 这 个 正则 表达 式 描述 的 是 ，“ 任 意 数 字 (至 少 有 一 个 ) ， 后 面 有 连 字符 号 
(-) ， 然 后 是 任意 个 数 的 数字 (至 少 有 一 个 ) ， 接 着 是 另 一 个 连 字符 号 C) ， 最 后 还 是 任意 
数字 (至 少 有 一 个 ) 的 集合 。”， 我 们 用 search() 来 测试 这 个 正则 表达 式 : 

>>> patt = '\d+-\d+-\d+' 


>>> re.search(patt, data).group() # 全 部 匹配 部 分 
'1171590364-6-8' 


Me eL ien 这 是 为 什么 呢 ? 因为 匹配 从 字符 串 的 起 始 位 置 开 
井 行 的 ， 而 我 们 要 找 的 数值 字符 串 在 末尾 。 我 们 只 能 再 写 一 个 匹配 全 部 字符 串 的 正则 表达 
。 还 有 一 个 偷懒 的 办 法 ， 就 是 用 “.+” 来 表示 任意 个 字符 集 ， 后 面 再 接 上 我 们 丨 正 感 兴 趣 的 数 


E 


patt = 1 .+\dt-\d+-\d+' 
>>> re.match (patt, data).group() # 全 部 匹配 部 分 


'"Thu Feb 15 17:46:04 2007::uzifzfedpyivihw.gov::1171590364-6-8"' 


这 个 方法 不 错 ， 可 是 我 们 只 想 获得 每 行 末 尾数 字 的 字段 ， 而 不 是 整个 字符 串 ， 所 以 需要 用 辆 
括号 将 我 们 感 兴 趣 的 那 部 分 数据 分 成 一 组 : 


>>> patt = '.*(Md*-NMd*-Nd*)' 
>>> re.match(patt, data) .group (1) # 子 组 1 
'4-6-8' 


到 底 怎 么 回 事 呢 ? 我 们 本 应 该 得 到 数据 “1171590364-6-8”， 而 不 应 该 是 “4-6-8” 啊 。 第 一 个 整 型 
字段 的 前 半 部 分 到 哪里 去 了 呢 ? 原因 是 : 正则 表达 式 本 身 默 认 是 贪心 匹配 的 。 也 就 是 说 ， 如 
果 正 则 表达 式 模式 中 使 用 到 通 配 字 ， 那 它 在 按照 从 左 到 右 的 顺序 求 值 时 ， 会 尽量 " 抓 取 ”满足 匹 
配 的 最 长 字符 串 。 在 我 们 上 面 的 例子 里 ，“ +" 会 从 字符 串 的 起 始 处 抓 取 满足 模式 的 最 长 字符 ， 

其 中 包括 我 们 想得到 的 第 一 个 整 型 字段 的 中 的 大 部 分 。"\d+" 只 需 一 位 数字 就 可 以 匹配 ， 所 以 
它 匹配 了 数字 cq ， 而 <+" 则 匹配 了 从 字符 事 起 始 到 坟 这 个 第 一 位 数字 “4" 之 间 的 所 有 字符 : "Thu 
Feb 15 17:46:04 2007::uzifzf@dpyivihw.gov::117159036”， 如 图 15-2 所 示 。 








+ I$ a greedy operator 








si fz fedpyivihw.gov: :1171590384-6-8 | 
—E-——— = — 8 














图 15-2 为 什么 匹配 错 了 : “+? 是 贪心 的 量词 (操作 符 ) 


一 个 解决 办 法 是 用 " 非 贪 焚 " 操 作 符 "?"。 这 个 操作 符 可 以 用 在 “、"“+ "或 "“? ”的 后 面 。 它 的 作用 
是 要 求 正 则 表达 式 引 擎 匹配 的 字符 越 少 越 好 。 因 此 ， 如 果 我 们 把 "? AE". er 面 ， 我 们 就 
得 到 了 想 要 的 结果 ， 见 图 15-3。 


* is a greedy operator 


Thu Feb 15 17:46:04 2007: :uzi £z fadpyivihw.gov: 117159036]4-6-8 | 


\d+-\d+-\d -一 





15-3 MUR RAE EGRE :“? "要 求 非 仿 禁 " 匹 配 


>>> patt = "to(Ndt-\dt= dtr)" 
>>> re.match(patt, data) .group (1) # 子 组 1 
'1171590364-6-8' 


另 一 种 办 法 ， 更 简单 ， 注 意 运 用 “::" 做 字段 分 隔 符 号 。 你 可 以 用 一 般 字符 串 的 strip :) 7 
法 ， 得 到 全 部 字符 ， 然 后 用 strip C-) 得 到 你 要 找 的 三 个 整 型 字段 。 我 们 现在 不 采用 这 种 方 
法 ， 因 为 我 们 的 脚本 gendata.py 正 是 通过 这 种 方法 把 字符 组 合 到 一 起 的 。 

最 后 一 个 例子 : 假设 我 们 只 想 抽 取 三 个 整 型 字段 里 中 间 的 那个 整 型 部 分 。 我 们 是 这 么 做 的 
(用 搜索 ， 这 样 就 不 必 匹 配 整个 字符 了 ) :“- (\d+) -”。 用 这 个 模式 “-(\d+) -”， 我 们 得 到 : 
»»» patt = '-(Md*)-' 


>>> m = re.search (patt, data) 


>>> m.group() i387 UC RC 

1 —-6- ' 

»»» m.group (1) # 子 组 Y 
'6' 


在 本 章 中 ， 有 很 多 正则 表达 式 的 强大 功能 我 们 未 能 涉及 ， 由 于 篇 幅 所 限 ， 我 们 无 法 详细 介绍 
它们 。 但 我 们 希望 所 提供 的 信息 和 技巧 对 你 的 编程 实践 有 所 帮助 。 我 们 建议 你 参阅 有 关 文 档 
以 获得 更 多 在 Python 语言 中 使 用 正则 表达 式 的 知识 。 要 精通 正则 表达 式 ， 我 们 建议 你 阅读 
Jeffrey E.F.Friedl 所 编写 的 《精通 正则 表达 式 》 (Mastering Regular Expressions) 一 书 。 


15.5 练习 


正则 表达 式 。 根 据 要 求 写 出 练习 15-1 一 15-12 相 应 的 正则 表达 式 


o o5 
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15-1. 识 别 下 列 字 符 囊 : “bat*、“bit*、“but”、“hat”、“hit* 或 “hut”。 
15-2. 匹 配 用 一 个 空格 分 隔 的 任意 一 对 单词 ， 比 如 名 和 姓 。 


15-3. 匹 配 用 一 个 过 号 和 一 个 宝 格 分 开 的 一 个 单词 和 一 个 字母 。 例 如 英文 人 名 中 的 姓 和 名 
的 首 字母 。 


15-4. 匹 配 所 有 合法 的 Python 标识 符 。 


15-5. 请 根据 你 〈 读 者 ) 本 地 关于 地 址 的 格式 写法 匹配 一 个 街道 地 址 ( 写 出 的 正则 表达 式 
要 尽 可 能 通用 以 匹配 任意 数目 的 表示 街道 名 字 的 单词 ， 包 括 类 型 指示 ) 。 比 如 ， 美 国 的 
街道 地 址 使 用 这 样 的 格式 : 1180 Bordeaux Drive。 使 你 写 的 正则 表达 式 尽 可 能 通用 ， 要 
求 能 够 匹配 多 个 单词 的 街道 名 字 ， 如 : 3120 De la Cruz Boulevard ° 


15-6. 匹 配 简单 的 以 “www.” 开 头 ， 以 “com" 作 结尾 的 Web 域 名 ， 例 如 : www.yahoo.com. 
附加 题 : 使 你 写 的 正则 表达 式 还 支持 其 他 顶级 域名 如 .edu、.net 等 比如 www.ucsc.edu。 

15-7. 匹 配 全 体 Python 整 型 的 字符 串 表 示 形 式 的 集合 。 

15-8. 匹 配 全 体 Python 长 整 型 的 字符 串 表 示 形 式 的 集合 。 

15-9. 匹 配 全 体 Python 浮 点 型 的 字符 串 表 示 形 式 的 集合 。 

15-10. 匹 配 全 体 Python 复 数 的 字符 串 表 示 形 式 的 集合 。 


15-11. 匹 配 所 有 合法 的 电子 邮件 地 址 〈 先 写 出 一 个 限制 比较 宽松 的 正则 表达 式 ， 然 后 尽 可 
能 加 强 限 制 条 件 ， 但 要 保证 功能 的 正确 性 ) 。 


15-12. 匹 配 所 有 合法 的 Web 网 站 地 址 (URL) ( 先 写 出 一 个 限制 比较 宽松 的 正则 表达 
式 ， 然 后 尽 可 能 加 强 限制 条 件 ， 但 要 保证 功能 的 正确 性 ) o 


15-13.type().type() 内 建 函 数 返 回 一 个 对 象 类 型 ， 此 对 象 显示 为 Python 的 字符 串 形 式 ， 如 
下 所 示 : 

>>> type(0) 

«type 'int'» 

>>> type(.34) 

«type 'float'» 

>>> type (dir) 


«type 'builtin function or method'» 
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请 写 一 个 正则 表达 式 ， 能 从 这 个 字符 囊 中 提取 出 类 型 的 名 字 。 你 的 函数 能 实现 以 下 

功能 : 如 果 以 字符 串 “<type'int>” 做 输入 ， 会 返回 类 型 "int” (返回 其 他 类 型 也 同 理 ， 

如 ， 返 回 类 型 loat’，'‘builtinfunction_or_method' 等 )。 提 示 : 正确 的 结果 保存 在 类 
和 茶 些 内 建 类 型 的 \ name 属性 里 。 


15-14. 正 则 表达 式 。 在 15.2 小 节 里 ， 我 们 给 出 一 个 匹配 由 一 位 或 两 位 数字 代表 一 月 到 九 月 
的 字符 囊 形式 (071-9) 。 请 写 出 一 个 正则 表达 式 表示 标准 日 历 上 其 他 的 三 个 月 (十 
月 、 十 一 月 、 干 二 月 ) 。 


15-15. 正 则 表达 式 。 在 15.2 小 节 里 ， 我 们 给 出 一 个 匹配 信用 卡 卡号 的 模式 : (“[0-9]{15， 
16y) 。 但 这 个 模式 不 允许 用 连 字符 号 分 割 信用 卡 卡号 中 的 数字 。 请 写 出 一 个 允许 使 用 连 
字符 的 正则 表达 式 ， 但 要 求 连 字符 必须 出 现在 正确 的 位 置 。 例 如 ，15 位 的 信用 卡 卡号 的 
格式 是 4-6-5， 表 示 四 个 数字 ， 一 个 连 字 符 ， 后 面 接 6 个 数字 、1 个 连 字符 ， 最 后 是 5 个 数 
字 。16 位 的 信用 卡 卡号 的 格式 是 4-4-4-4， 数 位 不 足 时 ， 添 0 补 位 。 附 加 题 : 有 一 个 用 于 

确定 某 个 信用 卡 卡 号 是 否 合法 的 算法 。 请 写 一 段 代码 ， 它 不 但 能 识别 格式 正确 的 信用 卡 
卡号 ， 还 能 验证 它 的 有 效 性 。 下 面 几 个 问题 (练习 15-16~15-27) 专门 处 理 gendata.py 生 
成 的 数据 。 在 做 练习 15-17 和 15-18 之 前 ， 请 先 把 练习 15-16 和 所 有 正则 表达 式 做 出 来 。 


15-16. 修 改 脚本 gendata.py 的 代码 ， 使 数据 直接 写 入 文件 redata.txt 中 ， 而 不 是 输出 到 屏 
幕 上 。 

15-17. 统 计生 成 的 redata.txt 文 件 中 ， 星 期 中 的 每 一 天 出 现 的 次 数 〈 或 统计 各 月 份 出 现 的 
次 数 ) 。 


15-18. 通 过 检查 每 个 输出 行 中 整 型 字段 部 分 的 第 一 个 整 型 是 否 和 该 行 开头 的 时 间 戳 相 匹 
配 来 验证 redata.txt 中 的 数据 是 否 完好 。 


根据 各 练习 的 要 求 写 出 相应 的 正则 表达 式 。 
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15-19. 提 取出 每 行 中 完整 的 时 间 改 字段 。 

15-20. 提 取出 每 行 中 完整 的 电子 邮件 地 址 。 

15-21. 只 提取 出 时 间 改 字段 中 的 月 份 。 

15-22. 只 提取 出 时 间 惟 字段 中 的 年 份 。 

15-23. 只 提取 出 时 间 改 字段 中 的 值 (格式 : HH:MM:SS) 。 


15-24. 只 从 电子 邮件 地 址 中 提取 出 登录 名 和 域名 ( 包括 主 域名 和 顶级 域名 ， 二 者 连 在 一 
AR) e 


15-25. 只 从 电子 邮件 地 址 中 提取 出 登录 名 和 域名 (包括 主 域名 和 顶级 域名 ， 二 者 分 别提 
取 ) e 


15-26. 将 每 行 中 的 电子 邮件 地 址 蔡 换 为 你 自己 的 电子 邮件 地 址 。 


15-27. 提 取出 时 间 惟 中 的 月 、 日 、 年 ， 并 按照 格式 “月 日 ， 年 "显示 出 来 ， 且 每 行 仅 遍 历 


一 次 。 


我 们 在 小 节 15.2 中 使 用 的 一 个 匹配 电话 号 码 的 正则 表达 式 ， 其 中 电话 号 码 允 许 包 含 可 选 的 区 
号 前 级 : \d{3}-\d{3}-\d{4}. 请 在 练习 15-28 和 15-29 中 ， 修 改 这 个 正则 表达 式 ， 使 它 满足 : 


15-28. 区 号 (第 一 组 的 三 个 数字 和 它 后 面 的 连 字 符 ) 是 可 选 的 ， 即 ， 你 写 的 正则 表达 式 
对 800-555-1212 和 555-1212 都 可 以 匹配 。 


15-29. 区 号 中 可 以 包含 圆 括 号 或 是 连 字符 ， 而 且 它 们 是 可 选 的 ， 就 是 说 你 写 的 正则 表达 
式 可 以 匹配 800-555-1212、555-1212 或 (800) 555-1212 ° 
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e 套 接 字 : 通信 终点 

e 套 接 字 地 址 

e 面向 连接 与 无 连接 套 接 字 
+ Python 中 的 网 络 编程 

+ SOCKET 模 块 

e 套 接 字 对 象 方法 

+ TCP/IP 和 客户 端 和 服务 器 
4 UDP/IP 客 户 端 和 服务 器 
+ SocketServer 模 块 

* ” Twisted 框架 介 绍 

e 相关 模块 


在 本 章 中 ， 我 们 将 简要 介绍 如 何 使 用 套 接 字 进 行 网 络 编程 。 首 先 ， 我 们 将 给 出 一 些 网 络 编程 
方面 的 背景 资料 和 Python 中 使 用 套 接 字 的 方法 ， 然 后 介绍 如 何 使 用 Python 的 一 些 模 块 来 创建 
网 络 化 的 应 用 程序 。 


16.1 引言 


16.1.1 什么 是 客户 端 /服务 器 架构 


客户 端 /服务 器 架构 ?不 同 的 人 有 不 同 的 答案 。 这 要 看 你 问 的 是 什么 人 ， 以 及 指 的 是 软 
统 还 是 硬件 系统 了 。 但 是 ， 有 一 点 是 共通 的 : 服务 器 是 一 个 软件 或 硬件 ， 用 于 向 一 个 或 

Pn (EP) 提供 所 需要 的 “服务 "。 服 务 器 存在 的 唯一 目的 就 是 等 待 客 户 的 请 求 ， 给 这 
服务 ， 然 后 再 等 待 其 他 的 请 求 。 


客户 连 上 一 个 (预先 已 知 的 ) 服务 器 ， 提 出 自己 的 请 求 ， 发 送 必 要 的 数据 ， 然 后 

器 的 完成 请 求 或 说 明 失 败 原因 的 反馈 。 服 务 器 不 停 地 处 理 外 来 的 请 求 ， 而 客户 一 
一 个 服务 的 请 求 ， 等 竺 结果。 然后 结束 这 个 事务 。 客 户 之 后 也 可 以 再 提出 其 他 的 
请 求 ， 只 是 ， 这 个 请 求 会 被 视 为 另 一 个 不 同 的 事务 了 。 


16-1 展 示 了 如 今 最 常见 的 "客户 端 /服务 器 "结构 。 一 个 用 户 或 客户 端 电脑 通过 因特网 从 服务 
器 上 取 数 据 。 这 的 确 是 一 个 客户 端 /服务 器 架构 的 系统 ， 但 还 有 更 多 类 似 的 系统 满足 客户 端 / 服 
务 器 架构 。 而 有 全， 客户 端 /服务 器 架构 也 可 以 像 应 用 到 软件 上 那样 应 用 到 计算 机 硬件 上 。 


W 


f The Internet 





图 16-1 因特网 上 典型 的 客户 端 /服务 器 概念 
1. 硬 件 的 客户 端 /服务 器 架构 


打印 (机 ) 服务 器 是 一 个 硬件 服务 器 的 例子 Mio oU M jb bui 
机 (或 其 他 打印 设备 ) 。 这 样 的 计算 机 一 般 是 可 以 通过 网 络 访 问 的 ， 而 且 客 户 机 器 可 以 远 
发 送 打 印 请 求 给 它 。 


另 一 个 硬件 服务 器 的 例子 是 文件 服务 器 。 它 们 一 般 拥 有 大 量 的 存储 空间 ， 客 户 可 以 远程 访 
问 。 客 户 端 计算 机 可 以 把 服务 器 的 磁盘 映射 到 自己 本 地 ， 就 像 本 地 磁盘 一 样 使 用 它们 。 其 
中 ，Sun 公 司 的 NetworkFile System (NFS) 是 使 用 最 为 广泛 的 网 络 文件 系统 之 一 。 如 果 你 
事实 上 已 经 映射 了 一 个 网 络 上 的 磁盘 ， 但 你 却 不 知道 它 到 底 是 本 地 的 还 是 网 络 的 ， 那 客户 端 / 

务 器 系统 就 很 好 的 完成 了 它们 的 工作 。 其 目的 就 是 要 让 用 户 使 用 起 来 感觉 就 像 使 用 本 地 磁 
盘 一 样 。“ 抽 象 " 到 “一 般 的 磁盘 访问 "这 一 层面 之 后 ， 所 有 的 操作 就 都 是 一 样 的 了 ， 而 让 所 有 操 
作 都 一 样 的 “实现 " 则 要 依靠 各 自 的 程序 了 。 


2. 软 件 客户 端 /服务 器 架构 


软件 服务 器 也 是 运行 在 某 个 硬件 上 的 。 但 不 像 硬件 服务 器 那样 ， 有 专门 的 设备 ， 如 打印 机 、 
磁盘 等 。 软 件 服务 器 提供 的 服务 主要 是 程序 的 运行 、 数 据 的 发 送 与 接收 、 合 并 、 升 级 或 其 他 
的 程序 或 数据 的 操作 。 


如 今 ， 最 常用 的 软件 服务 器 是 Web 服 务 器 。 一 台 机 器 里 放 一 些 网 页 或 Web 应 用 程序 ， 然 后 启 
动 服务 。 这 样 的 服务 器 的 任务 就 是 接受 客户 端的 请 求 ， 把 网 页 发 给 客户 端 ( 如 用 户 计算 机 上 
的 浏览 器 ) ， 然 后 等 待 下 一 个 客户 端 请 求 。 这 些 服务 启动 后 的 目标 就 是 “永远 运行 下 去 "”。 虽 然 
它们 不 可 能 实现 这 样 的 目标 ， 但 只 要 没有 关机 或 硬件 出 错 等 外 力 干 扰 ， 它 们 就 能 够 运行 非常 
长 的 一 段 时 间 。 


数据 库 服务 器 是 另 一 种 软件 服务 器 。 它 们 接受 客户 端的 保存 或 读 取 请 求 ， 完 成 请 求 ， 然 后 再 
Pa 等 待 其 他 的 请 求 。 它们 也 被 设计 为 要 能 “永远 "运行 。 
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ge 是 那些 在 运行 时 需要 窗口 环境 的 
程序 ， 它 们 一 般 叫做 图 形 用 户 界 面 (GUI) 程序 。 这 些 程 序 如 果 在 一 个 DOS 窗 口 或 Unix 的 
shell 等 没有 窗口 服务 器 的 纯 文本 环境 中 运行 ， 将 无 法 启动 。 一 旦 窗口 服务 器 可 以 使 用 时 ， 那 
一 切 就 正常 了 。 

当世 界 有 了 网 络 ， 那 这 样 的 环境 就 开始 变 得 更 有 趣 了 。 一 般 情 况 下 ， 窗 口 客户 端的 显示 和 窗 
口服 务 器 的 提供 都 在 同一 台电 脑 上 。 但 在 X Window 之 类 的 网 络 化 的 窗口 环境 中 ， 你 可 以 选择 
其 他 电脑 的 窗口 服务 器 来 做 显示 。 即 你 可 以 在 一 台电 脑 上 运行 GUI 程序 ， 而 在 另 一 台电 脑 上 显 
TE! 

3. 银 行 出 纳 是 服务 器 吗 

理解 客户 端 /服务 器 架构 的 一 个 方法 是 ， 想 象 一 个 不 吃 不 喝 不 睡觉 的 银行 出 纳 ， 他 依次 向 排 成 
长 龙 的 顾客 们 提供 一 个 又 一 个 的 服务 (图 16-2) 。 有 时 ， 队 伍 可 能 很 长 ， a eod 
但 顾客 随时 都 可 能 出 现 。 当 然 ， 在 以 前 ， 是 不 可 能 有 这 样 的 出 纳 的 。 但 现在 的 ATM 机 与 这 
模型 很 像 。 
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图 16-2 图 中 的 银行 出 纳 " 永 远 不 停歇 "地 为 客户 提供 服务 





当然 ， 出 纳 就 是 一 个 运行 在 无 限 循 环 里 的 服务 器 。 每 一 个 顾客 就 是 一 个 想 要 得 到 服务 的 客 
户 。 顾 客 到 了 之 后 ， 就 按 先 来 先 服务 (fist-come-first-served, FCFS) 的 原则 得 到 服务 。 一 个 
事务 结束 后 ， 客 户 就 离开 了 ， 而 服务 器 则 要 么 马上 为 下 一 个 顾客 服务 ， 要 么 坐 着 等 待 下 一 个 
顾客 的 到 来 。 


为 什么 这 些 概念 那么 重要 ? 因为 ， 这 种 执行 的 方式 就 是 客户 端 /服务 器 架构 的 特点 。 现 在 你 对 
此 已 经 有 了 2 uu c di oun 


— 

o 
Jae 

~ 
O 
CD 


出 纳 运行 在 一 个 接收 请 求 ， 处 理 请 求 然后 再 处 理 其 他 请 求 或 等 待 其 他 客户 的 无 限 循 环 中 。 客 
户 有 可 能 已 经 排 起 了 长 龙 ， 也 有 可 能 根本 就 没有 客户 。 但 是 ， 无 论 如 何 ， 服 务 器 都 不 会 结 
工作 。 


16.1.2 ”客户 端 /服务 器 网 络 编程 


在 完成 服务 之 前 ， 服 务 器 必需 要 先 完 成 一 些 设置 。 先 要 创建 一 个 通讯 端点 ， 让 服务 器 能 “ 监 
听 ? 请 求 。 你 可 以 把 我 们 的 服务 器 比 做 一 个 公司 的 接待 员 或 回答 公司 总 线 M Dos eme 
电话 和 设备 安装 完成 ， 话 务 员 也 就 位 之 后 ， 服 务 就 可 以 开始 了 。 


在 网 络 世 界 里 ， 基 本 上 也 是 这 样 一 一 一 旦 通信 端点 创建 好 之 后 ， 我 们 在 “监听 ”的 服务 器 就 可 以 
进入 它 那 等 待 和 处 理 客户 请 求 的 无 限 循 环 中 了 了。 当然， 我 们 也 不 能 忘记 在 信纸 上 、 杂 志 里 、 
广告 中 印 上 公司 的 电话 号 码 。 否 则 ， 就 没有 人 会 打 电 话 进来 了 | 


同样 地 ， 服 务 器 在 准备 好 之 后 ， 也 要 通知 潜在 的 客户 ， 让 它们 知道 服务 器 已 经 准备 好 处 理 服 
务 了 ， 否 则 没有 人 会 提请 求 的。 比方 说 ， 你 建立 了 一 个 全 新 的 网 站 。 这 个 网 站 非常 出 色 ， 非 
常 的 吸引 人 ， 非 常 的 有 用 ， 是 所 有 网 站 中 最 酷 的 一 个 。 但 如 果 你 不 把 网 站 的 网 址 或 者 说 统一 
资源 定位 符 (URL) 广 而 告 之 的 话 ， 没 有 人 会 知道 这 个 网 站 的 存在 的 。 这 个 网 站 也 就 永远 不 
见 天 日 了 。 对 于 公司 总 部 的 新 电话 也 是 这 样 ， 你 不 把 电话 公之于众 ， 那 就 没有 人 会 打 电 话 进 


现在 ， 你 对 服务 器 如 何 工作 已 经 有 了 一 个 很 好 的 认识 。 你 已 经 完成 了 最 难 的 那 一 部 分 
人 
desde cd d ME C 0 
处 理 完成 ， 客 户 端 收 到 了 结果 ， 通 信 就 结束 了 。 


16.2 ZF : 通信 端点 


16.2.1 什么 是 套 接 字 


套 接 字 是 一 种 具有 之 前 所 说 的 “通信 端点 "概念 的 计算 机 网 络 数据 结构 。 网 络 化 的 应 用 程序 在 开 
始 任何 通讯 之 前 都 必需 要 创建 套 接 字 。 就 像 电 话 的 插口 一 样 ， 没 有 它 就 完全 没 办 法 通信 。 


套 接 字 起 源 于 20 世 纪 70 年 代 加 州 大 学 伯克利 分 校 版 本 的 Unix， 即 人 们 所 说 的 BSD Unix。 因 
此 ， 有 时 人 们 也 把 套 接 字 称 为 “伯克利 。 一 开始 ， 套 接 字 被 设计 用 在 同 
一 台 主 机 上 多 个 应 用 程序 之 间 的 通讯 。 这 也 被 称 作 进程 间 通 讯 ， 或 I|PC。 套 接 字 有 两 种 ， 分 别 
是 基于 文件 型 的 和 基于 网 络 型 的 。 


Unix 套 接 字 是 我 们 要 介绍 的 第 一 个 套 接 字 家 族 。 其 “家 族 名 "为 AF_UNIX (在 POSIX1.g 标 准 中 
也 叫 AF_ LOCAL ) ， 表 示 “ 地 址 家 族 : UNIX”。 包 括 Python 在 内 的 大 多 数 流行 平台 上 都 使 用 术 
语 “ 地 址 家 族 " 及 其 缩写 “AF”。 而 老 一 点 的 系统 中 ， 地 址 家 族 被 称 为 “ 域 " 或 “协议 家 族 *”， 并 使 用 


/& S "PF'fa X "AF" » EHE 83» AF LOCAL (在 2000-2001 年 被 列 为 标准 ) 将 会 代替 
AF_UNIX。 不 过 ， 为 了 向 后 兼容 ， 很 多 系统 上 ， 两 者 是 等 价 的 。Python 自 己 则 仍然 使 用 
AF UNIX ° 


由 于 两 个 进程 都 运行 在 同一 台 机 器 上 ， 而 且 这 些 套 接 字 是 基于 文件 的 。 所 以 ， 它 们 的 底层 结 
构 是 由 文件 系统 来 支持 的 。 这 样 做 相当 有 道理 ， 因 为 ， 同 一 台电 脑 上 ， 文 件 系统 的 确 是 不 同 
的 进程 都 能 访问 的 。 


另 一 种 套 接 字 是 基于 网 络 的 ， 它 有 自己 的 家 族 名 字 : AF_INET， 或 叫 “ 地 址 家 族 : Internet" » 
还 有 一 种 地 址 家 族 AF_INET6 被 用 于 网 际 协议 第 6 版 (IPv6) 寻 址 上 。 还 有 一 些 其 他 的 地 址 家 
族 ， 不 过 ， 它 们 要 么 是 只 用 在 某 个 平台 上 ， 要 人 么 就 是 已 经 被 废弃 ， 或 是 很 少 被 使 用 ， 或 是 根 
本 就 还 没有 实现 。 所 有 地 址 家 族 中 ，AF_INET 是 使 用 最 广泛 的 一 个 。Python 2.5 中 加 入 了 一 种 
Linux 套 接 字 的 支持 : AF NETLINK (无 连接 ( 稍 后 讲解 ) ) 套 接 字 家 族 让 用 户 代 码 与 内 核 代 
码 之 间 的 |PC 可 以 使 用 标准 BSD 套 接 字 接 口 。 而 且 ， 相 对 之 前 那些 往 操 作 系 统 中 加 入 新 的 系统 
调用 、proc 文 件 系 统 支持 或 是 "IOCTL” 等 复杂 的 方案 来 说 ， 这 种 方法 显得 更 为 精巧 ， 更 为 安 
Ao 


Python 只 支持 AF UNIX, AF NETLINK， 和 AF_INET 家 族 。 由 于 我 们 只 关心 网 络 编程 ， 所 以 
在 本 章 的 大 部 分 时 候 ， 我 们 都 只 用 AF_ INET ° 


16.2.2 AFLA : 主机 与 端口 


如 果 把 套 接 字 比 做 电话 的 插口 一 一 即 通信 的 最 底层 结构 ， 那 主机 与 端口 就 像 区 号 与 电话 号 码 
的 一 对 组 合 。 有 了 能 打 电 话 的 硬件 还 不 够 ， 你 还 要 知道 你 要 打 给 谁 ， 往 哪 打 。 一 个 因特网 地 
址 由 网 络 通 信 所 必需 的 主机 与 端口 组 成 。 而 且 不 用 说 ， 另 一 端 一 定 要 有 人 在 听 才 可 以 。 否 

则 ， 你 就 会 听 到 熟悉 的 声音 "对 不 起 ， 您 拨 的 是 空 号 ， 请 查询 后 再 拨 ”。 你 在 上 网 的 时 候 ， 可 能 
也 见 过 类 似 的 情况 ， 如 “不 能 连接 该 服务 器 。 服 务 器 无 响应 或 不 可 达 ”。 


合法 的 端口 号 范围 为 0~65535。 其 中 ， 小 于 1024 的 端口 号 为 系统 保留 端口 。 如 果 你 所 使 用 的 
是 Unix 操 作 系统 ， 那 么 就 可 以 通过 /etc/services 文 件 获 得 保留 的 端口 号 (及 其 对 应 的 服务 /协议 
和 套 接 字 类 型 ) 。 常 用 端口 号 列表 可 以 从 下 面 这 个 网 站 获得 : 


http://www.iana.org/assignments/port-numbers 


16.2.3 面向 连接 与 无 连接 
1. 面 向 连接 


无 论 你 使 用 哪 一 种 地 址 家 族 ， 套 接 字 的 类 型 只 有 两 种 。 一 种 是 面向 连接 的 套 接 字 ， 即 在 通信 
之 前 一 定 要 建立 一 条 连接 ， 就 像 跟 朋 友 打 电话 时 那样 。 这 种 通信 方式 也 被 称 为 " 庶 电 路 ?或 “ 流 
套 接 字 ”。 面 向 连接 的 通信 方式 提供 了 顺序 的 、 可 靠 的 、 不 会 重复 的 数据 传输 ， 而 且 也 不 会 被 


加 上 数据 边界 。 这 也 意味 着 ， 每 一 个 要 发 送 的 信息 ， 可 能 会 被 拆 分 成 多 份 ， 每 一 份 都 会 不 多 
不 少 地 正确 到 达 目 的 地 。 然 后 被 重新 按 顺序 拼装 起 来 ， 传 给 正在 等 待 的 应 用 程序 。 


实现 这 种 连接 的 主要 协议 就 是 传输 控制 协议 (FRTCP) 。 要 创建 TCP 套 接 字 就 得 在 创建 的 时 
候 指 定 套 接 字 类 型 为 SOCK_STREAM 。TCP 套 接 字 采用 SOCK_STREAM 这 个 名 字 ， 表 达 了 
它 作 为 流 套 接 字 的 特点 。 由 于 这 些 套 接 字 使 用 网 际 协议 IP) 来 查找 网 络 中 的 主机 ， 所 以 这 
样 形成 的 整个 系统 ， 一 般 会 由 这 两 个 协议 《TCP 和 IP) 名 的 组 合 来 描述 ， 即 TCP/IP。 


无 连接 


与 虚 电 路 完全 相反 的 是 数据 报 型 的 无 连接 套 接 字 。 这 意味 着 ， 无 需 建 立 连 接 就 可 以 进行 通 
讯 。 但 这 时 ， 数 据 到 达 的 顺序 、 可 靠 性 及 不 重复 性 就 无 法 保证 了 。 数 据 报 会 保留 数据 边界 ， 
这 就 表示 ， 数 据 是 整个 发 送 的 ， 不 会 像 面向 连接 的 协议 那样 被 先 拆 分 成 小 块 。 


使 用 数据 报 来 传输 数据 就 像 邮政 服务 一 样 。 邮 件 和 和 包 庄 不 一 定 会 按 它们 发 送 的 顺序 到 达 。 事 
实 上 ， 它 们 还 有 可 能 根本 到 达 不 了 ! 而 且 ， 在 网 络 中 报 文 甚至 会 重复 发 送 ， 这 也 增加 了 复杂 
小 o 


(DNO E 么 多 缺点 ， 为 什么 还 要 使 用 它 呢 ? (一 定 有 能 胜 过 流 套 接 字 的 功能 ! ) 由 于 
向 连接 套 接 字 要 提供 一 些 保 证 ， 以 及 要 维持 虚 电 路 连接 ， 这 都 是 很 重 的 额外 负担 。 数 据 报 
e 些 负担 ， 所 以 它 更 “便宜 "。 通 常 能 提供 更 好 的 性 能 ， 更 适合 某 些 应 用 场合 。 


实现 这 种 连接 的 主要 协议 就 是 用 户 数据 报 协议 〈 即 UDP) 。 要 创建 UDP 套 接 字 就 得 在 创建 的 
时 候 指定 套 接 字 类 型 为 SOCK_DGRAM。 SOCK_DGRAM 这 个 名 字 ， 也 许 你 已 经 猜 到 了 ， 来 
自 于 单词 “datagram”(“ 数 据 报 ") 。 由 于 这 些 套 接 字 使 用 网 际 协议 来 查找 网 络 中 的 主机 ， 这 样 
形成 的 整个 系统 ， 一 般 会 由 这 两 个 协议 (UDP 和 |P) 名 的 组 合 来 描述 ， 即 UDP/IP。 


16.3 Python 中 的 网 络 编程 
现在 ， 你 已 经 有 了 足够 的 客户 端 /服务 器 架构 、 套 接 字 和 网 络 方面 的 知识 。 我 们 现在 就 开始 把 


这 2211 Python 中 来 。 本 节 中 ， 我 们 将 主要 使 用 socket 模块 。 模 块 中 pe 
创建 套 接 字 。 套 接 字 也 有 自己 的 一 套 函 数 来 提供 基于 套 接 字 的 网 络 通 信 


16.3.1 socket() 模 块 函 数 


要 使 用 socket.socket() 元 数 来 创建 套 接 字 。 其 语法 如 下 : 


socket(socket family, socket type, protocol-0) 


如 前 所 述 ，Socket，family 不 是 AF _VNIX 就 是 AF_INET socket type 可 以 是 SOCK_STREAM 
或 SOCK_DGRAM， 这 一 点 前 面 已 说 过 。protocol 一 般 不 填 ， 默 认 值 为 0。 


创建 一 个 TCP/IP 的 套 接 字 ， 你 要 这 样 调用 socket.socket(): 
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tcpSock = socket.socket(socket.AF INET, socket.SOCK STREAM) 
同样 地 ， 创 建 一 个 UDP/IP 的 套 接 字 ， 你 要 这 样 : 
udpSock = socket.socket(socket.AF INET, socket.SOCK DGRAM) 


由 于 socket 模 块 中 有 太 多 的 属性 ， 我 们 在 这 里 破例 使 用 了 from module import” 语句。 使 
用 'fromsocket import:， 我 们 就 把 socket 模 块 里 的 所 有 属性 都 带 到 我 们 的 命名 空间 里 了， 这样 
能 大 幅 减 短 我 们 的 代码 。 


tcpSock = socket(AF INET, SOCK STREAM) 
当 我 们 创建 了 套 接 字 对 象 后 ， 所 有 的 交互 都 将 通过 对 该 套 接 字 对 象 的 方法 调用 来 进行 。 


16.3.2 ” 套 接 字 对 象 (AZ) 方法 


表 16.1 中 ， 我 们 列 出 了 最 常用 的 套 接 字 对 象 的 方法 。 在 下 一 个 小 节 中 ， 我 们 将 分 别 创建 TCP 
和 UDP 的 客户 端 和 服务 器 ， 它 们 都 要 用 到 这 些 方 法 。 虽 然 我 们 只 关心 因特网 套 接 字 ， 但 是 这 
些 方 法 在 Unix 套 接 字 中 的 也 有 类 似 的 意义 。 











3 16.1 套 接 字 对 象 的 常用 函数 
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核心 提示 : 在 运行 网 络 应 用 程序 时 ， 最 好 在 不 同 的 电脑 上 执行 服务 器 和 
客户 端的 程序 。 


在 本 章 的 例子 中 ， 你 将 看 到 大 量 的 代码 和 输出 中 提 及 “localhost 主 机 和 127.0.0.1IP 地 址 。 例 子 
中 客户 端 与 服务 器 运行 在 同一 台电 脑 上 ， ， 并 把 代码 放 到 不 同 的 电 
脑 上 和 运行。 眼看 着 自己 的 代码 让 不 同 的 电脑 在 网 络 上 进行 通讯 ， 这 一 时 刻 ， 你 更 能 体会 到 开 
发 的 乐趣 。 


16.3.3 ”创建 一 个 TCP 服 务 器 


我 们 首先 将 给 出 一 个 关于 如 何 创 建 一 个 通用 的 TCP 服 务 器 的 伪 人 代码， 然后 解释 会 发 生 什 么 问 
题 。 要 注意 的 是 ， 这 只 是 设计 服务 器 的 一 种 方法 ， 当 你 对 服务 器 的 设计 有 了 一 定 的 了 解 之 
后 ， 你 就 能 用 你 所 希望 的 方式 来 修改 这 段 伪 代码 : 


ss = socket () & 创建 服务 器 套 接 字 
ss.bind() & 把 地 址 绑 定 到 套 接 字 上 
ss.listen() # 监听 连接 
inf loop: & 服务 器 无 限 循环 
cs = ss.accept () # 接受 客户 端 连接 
comm loop: # 通信 循环 
cs.recv()/cs.send() & xp GEL SARI) 
cs.close() # 关闭 客户 端 套 接 字 
ss.close() # 关闭 服务 器 套 接 字 《〈 可 选 ) 


所 有 的 套 接 字 都 用 socket.socket() 函 数 来 创建 。 服 务 器 需要 "“ 坐 在 某 个 端口 上 ?等待 请 求 。 所 以 
它们 必需 要 "“ 绑 定 ? 到 一 个 本 地 的 地 址 上 。 由 于 TCP 是 一 个 面向 连接 的 通信 系统 ， 在 TCP 服 务 器 
可 以 开始 工作 之 前 ， 要 先 完 成 一 些 设 置 。TCP 服 务 器 必须 “监听 ”( 进 来 的 ) 连接 ， 设 置 完成 之 
后 ， 服 务 器 就 可 以 进入 无 限 循环 了 。 


一 个 简单 的 (单线 程 的 ) 服务 器 会 调用 accept() 函 数 等 待 连接 的 到 来 。 默 认 情 况 下 ，accept() 
函数 是 阻塞 式 的 ， 即 程序 在 连接 到 来 之 前 会 处 于 挂 起 状态 。 套 接 字 也 支持 非 阻塞 模式 。 请 参 
阅 相 关 文 档 或 操作 系统 手册 以 了 解 为 何 及 如 何 使 用 非 阻塞 套 接 字 。 


一 旦 接收 到 一 个 连接 ，accept() 函 数 就 会 返回 一 个 单独 的 客户 端 套 接 字 用 于 后 续 的 通信 。 使 用 
新 的 客户 端 套 接 字 就 像 把 客户 的 电话 转 给 一 个 客户 服务 人 员 。 当 一 个 客户 打 电 话 进 来 的 时 
候 ， 总 机 接 了 电话 ， 然 后 把 电话 转 到 合适 的 人 那里 来 处 理 客户 的 需求 。 


这 样 就 可 以 空 出 总 机 ， 也 就 是 最 初 的 那个 服务 器 套 接 字 ， 于 是 ， 话 务 员 就 可 以 等 待 下 一 个 电 
E (客户 端 请 求 ) ， 与 此 同时 ， 前 一 个 客户 与 对 应 的 客户 服务 人 员 在 另 一 条 线路 上 进行 着 他 
们 之 间 的 对 话 。 同 样 的 ， 当 一 个 请 求 到 来 时 ， 要 创建 一 个 新 的 端口 ， 然 后 直接 在 那个 端口 上 
与 客户 对 话 ， 这 样 就 可 以 空 出 主 端口 来 接受 其 他 客户 的 连接 。 





核心 提示 : 创建 线程 来 处 理 客户 端 请 求 。 


我 们 不 打算 在 例子 里 实现 这 样 的 功能 。 但 是 ， 创 建 一 个 新 的 线程 或 进程 来 完成 与 客户 端 通讯 
是 一 种 非常 常用 的 手段 。SocketServer 模 块 是 一 个 基于 socket 模 块 的 高 级 别 的 套 接 字 通 讯 模 
块 ， 它 支持 在 新 的 线程 或 进程 中 处 理 客 户 端 请 求 。 建 议 读者 参阅 相关 文章 及 第 17 章 的 习题 ， 
以 了 解 更 多 的 信息 。 


在 临时 套 接 字 创 建 好 之 后 ， 通 信 就 可 以 开始 了 。 客 户 与 服务 器 都 使 用 这 个 新 创建 的 套 接 字 进 
行 数据 的 发 送 与 接收 ， 直 到 通讯 的 某 一 方 关 闭 了 连接 或 发 送 了 一 个 空 字符 串 之 后 ， 通 讯 就 结 
Aye 


在 代码 中 ， 当 客户 端 连接 关闭 后 ， 服 务 器 继续 等 待 下 一 个 客户 端的 连接 。 代 码 的 最 后 一 行 ， 
会 把 服务 器 的 套 接 字 关 闭 。 由 于 服务 器 处 在 无 限 循 环 中 ， 不 可 能 会 走 到 这 一 步 ， 所 以 ， 这 一 
步 是 可 选 的 。 我 们 写 这 一 句 话 的 主要 目的 是 要 提醒 读者 ， 在 设计 一 个 更 智能 的 退出 方案 时 ， 
比方 说 ， 服 务 器 被 通知 要 关闭 时 ， 要 确保 close() 函 数 会 被 调用 。 


在 例 16.1 的 tsTserv.py 文 件 中 ， 会 创建 一 个 TCP 服 务 器 程序 ， 这 个 程序 会 把 客户 端 发 送 过 来 的 
字符 串 加 上 一 个 时 间 改 (格式 : '[ 时 间 ] 数 据 ') 返回 给 客户 端 〈“tsTserv" 代 表 时 间 惟 TCP 服 务 
器 。 其 他 文档 的 命令 将 与 此 类 似 ) 。 


例 16.1 TCP 时 间 改 服务 器 (tsTserv.py) 


创建 一 个 能 接收 客户 端的 消息 ， 在 消息 前 加 一 个 时 间 惟 后 返回 的 TCP 服 务 器 。 
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#!/usr/bin/env python 


from socket import * 


from time import ctime 


HOST-'' 

PORT-21567 

BUFSIZ - 1024 

ADDR - (HOST, PORT) 


tcpSerSock = socket(AF INET, SOCK STREAM) 
tcpSerSock.bind (ADDR) 
tcpSerSock.listen(5) 


while True: 
print 'waiting for connection...' 
tcpCliSock, addr = tcpSerSock.accept() 


print '...connected from:', addr 


while True: 
data = tcpCliSock.recv (BUFSIZ) 


if not data: 


break 
tcpCliSock.send('[$s] $s' * ( 
ctime(), data)) 


tcpCliSock.close() 
tcpSerSock.close() 


逐 行 解释 


1~4 行 


KA 


$148 


是 Unix 的 启动 信息 行 ， 随 后 我 们 导入 了 time.ctime() 函 数 和 socket 模 块 的 所 有 属性 。 


6 ~ 13 行 


HOST 变量 为 室 ， 表 示 bind() 函 数 可 以 绑 定 在 所 有 有 效 的 地 址 上 。 我 们 还 选用 了 一 个 随机 生成 
的 未 被 占用 的 端口 号 。 在 程序 中 ， 我 们 把 缓冲 区 的 大 小 设 定 为 1K。 你 可 以 根据 网 络 情况 和 应 
用 的 需要 来 修改 这 个 大 小 。listen() 函 数 的 参数 只 是 表示 最 多 允许 多 少 个 连接 同时 连 进来 ， 而 
后 来 的 连接 就 会 被 拒绝 掉 。 


TCP 服 务 器 的 套 接 字 (tcpSerSock) 在 第 11 行 被 生成 。 随 后 把 套 接 字 绑 定 到 服务 器 的 地 址 
上 ， 然 后 开始 TCP 监 听 。 

15 ~ 28 行 

在 进入 到 服务 器 的 无 限 循环 后 ， 我 们 (被动 地 ) 等 待 连接 的 到 来 。 当 有 连接 时 ， 我 们 进入 对 
话 循环 ， 等 待 客户 端 发 送 数 据 。 如 果 消 息 为 室 ， 表 示 客 户 端 已 经 退出 ， 那 就 再 去 等 待 下 一 个 
客户 端 连接 。 得 到 客户 端 消息 后 ， 我 们 在 消息 前 加 一 个 时 间 玲 然后 返回 。 最 后 一 行 不 会 被 执 
行 到 ， 放 在 这 里 用 于 提醒 读者 ， 在 服务 器 要 退出 的 时 候 ， 要 记得 调用 close() 函 数 。 


16.3.4 &] iE TCP & P 35 


创建 TCP 客 户 端 相对 服务 器 来 说 更 为 容易 。 与 TCP 服 务 器 那 节 美 似 ， 我 们 也 是 先 给 出 伪 代 码 
及 其 解释 ， 然 后 再 给 出 真正 的 代码 。 


cs = socket () # 创建 客户 端 套 接 字 
cs.connect () # 尝试 连接 服务 器 
comm loop: # 通信 循环 
cs.send()/cs.recv() # 对 话 〈 发 送 / 接 收 ) 
cs.close() # 关闭 客户 端 套 接 字 


如 前 所 述 ， 所 有 的 套 接 字 都 由 socket.socket() 函 数 创 建 。 在 客户 端 有 了 套 接 字 之 后 ， 马 上 就 可 
以 调用 connect() 有 函数 去 连接 服务 器 。 连 接 建 立 后 ， 就 可 以 与 服务 器 开始 对 话 了 。 在 对 话 结束 
后 ， 客 户 端 就 可 以 关闭 套 接 字 ， 结 束 连接 。 


在 例 16.2 中 ， 我 们 给 出 了 TsTelnt ,py 的 代码 。 程 序 连接 到 服务 器 ， 提 示 用 户 输入 要 传输 的 数 


据 ， 然 后 通过 客户 端 代码 显示 服务 器 返回 的 加 了 时 间 惟 的 结果 。 
逐 行 解释 
1~ 3 行 


第 1 行 是 Unix 的 启动 信息 行 ， 随 后 我 们 导入 了 socket 模 块 的 所 有 属性 。 
例 16.2 TCPH HREP 3& 〈tsTclnt.py ) 


创建 一 个 TCP 客 户 端 程序 会 提示 用 户 输入 要 传 给 服务 器 的 信息 ， 显 示 服 务 器 返回 的 加 了 时 
间 惟 的 结果 。 
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1l k'!/usr/bin/env python 


from socket import * 


3 
4 
S:  HOST-' localhost ' 

6 |PORT-21567 

T BUFSIZ = 1024 

8 ADDR = (HOST, PORT) 

9 

10 tcpCliSock = socket(AF INET, SOCK STREAM) 
11 tcpCliSock.connect (ADDR) 

12 

13 while True: 


14 data = raw input('» ') 

L9 if not data: 

16 break 

17 tcpCliSock.send (data) 

18 data = tcpCliSock.recv (BUFSIZ) 
19 if not data: 

20 break 

21 print data 

22 


23 tcpCliSock.close() 
5~ 11 行 


HOST 和 PORT 变量 表示 服务 器 的 主机 名 与 端口 号 。 由 于 我 们 在 同一 台电 脑 上 进行 测试 ， 所 以 
HOST 里 放 的 是 本 机 的 主机 名 (如 果 你 的 服务 器 运行 在 其 他 电脑 上 ， 要 做 相应 的 修改 ) sa 
号 要 与 服务 器 上 的 设置 完全 相同 (不 然 就 没 办 法 通信 了 ) 。 缓 冲 区 的 大 小 还 是 设 为 1K。 


TCP 客 户 套 接 字 (tcpCliSock) 在 第 10 行 创建 。 然 后 就 去 连接 服务 器 。 


13 ~ 23 行 
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客户 端 也 有 一 个 无 限 循 环 ， 但 这 跟 服 务 器 的 那个 不 期 望 退 出 的 无 限 循 环 不 一 样 。 客 户 端的 循 

环 在 以 下 两 个 条 件 的 任意 一 个 发 生 后 就 退出 : 用 户 没有 输入 任何 内 容 (14 一 16 行 ) 或 服务 器 

由 于 某 种 原因 退出 ， 导 致 recv() 函 数 失 败 (18~20 行 ) 。 和 否则 ， 在 一 般 情 况 下 ， 客 户 端 会 把 用 
户 输入 的 字符 串 发 给 服务 器 进行 处 理 ， 然 后 接收 并 显示 服务 器 传 回来 的 如 了 时 间 戳 的 字符 

$ o 


16.3.5 ”运行 我 们 的 客户 端 与 TCP 服 务 器 


现在 ， 我 们 来 运行 服务 器 和 客户 端 程序 ， 看 看 它们 的 运行 情况 如 何 。 我 们 应 该 先 运 行 服务 器 
还 是 客户 呢 ? 很 显然 ， 如 果 我 们 先 运行 客户 端 ， 由 于 没有 服务 器 在 等 待 请 求 ， 客 户 端 没 办 法 
做 连接 。 服 务 器 是 一 个 被 动 端 ， 它 先 创建 自己 然后 被 动 地 等 待 连接 。 而 客户 端 则 是 主动 端 ， 
由 它 主动 地 建立 一 个 连接 。 所 以 : 


要 先 开 服 务 器 ， 后 开 客 户 端 。 


我 们 在 运行 客户 端 和 服务 器 的 例子 中 ， 使 用 了 同一 台电 脑 。 其 实 也 可 以 把 服务 器 放 在 其 他 的 
电脑 上 ， 这 时 只 要 改 改 主机 名 就 好 了 。 (看 到 自己 写 的 第 一 个 网 络 程序 运行 在 不 同 的 电脑 
本 > REZZA 么 激动 人 心 的 事 啊 ) £ 


下 面 就 是 客户 端的 输入 与 输出 ， 不 输入 数据 直接 按 回 车 键 就 可 以 退出 程序 : 


$ tsTclnt.py 


= Pi 


[Sat Jun 17 17:27:21 2006] hi 
» spanish inquisition 
[Sat Jun 17 17:27:37 2006] spanish inquisition 


> 


$ 

务 器 的 输出 主要 用 于 调试 目的 : 

$ tsTserv.py 

waiting for connection... 


.connected from: ('127.0.0.1', 1040) 


waiting for connection... 


当 有 客户 端 连接 上 来 的 时 候 ， 会 显示 一 个 “...connected from...” 信 息 。 在 客户 端 接受 服务 的 时 
候 ， 服 务 器 又 回去 等 待 其 他 客户 端 和 连接。 在 从 服务 器 Lad DES 我 们 要 跳出 那个 无 限 循 
这 时 会 触发 一 个 异常 。 避 免 这 种 错误 的 方法 是 采用 一 种 更 优雅 的 退出 方式 。 





核心 提示 : 优雅 的 退出 和 调用 服务 器 的 close() 有 函数 


“友好 地 ?退出 的 一 个 方法 就 是 把 服务 器 的 while 循 环 放 在 一 个 try-except 语 名 的 except 子 幻 当 
中 ， 并 捕获 EOFError 和 Keyboardlnterrupt 异 常 。 在 except 子 名 中 ， 调 用 close() 有 函数 关闭 服务 
器 的 套 接 字 。 


这 个 简单 的 网 络 应 用 程序 的 有 趣 之 处 并 不 仅仅 在 于 我 们 Ce 端 传 到 服务 
器 ， 然 后 又 传 回 给 客户 端 ， 而 且 我 们 还 把 这 个 服务 器 当成 了 “时 间 服 务 器 ”， 因 为 ， 字 符 串 中 的 
时 间 惟 完全 是 来 自 于 服务 器 的 。 


16.3.6 ”创建 一 个 UDP 服务 器 


由 于 UDP 服务 器 不 是 面向 连接 的 ， 所 以 不 用 像 TCP 服 务 器 那样 做 那么 多 设置 工作 。 事 实 上 ， 
并 不 用 设置 什么 东西 ， 直 接 等 待 进来 的 连接 就 好 了 。 


SS = socket () # 创建 一 个 服务 器 套 接 字 
ss.bind() E 绑 定 服务 器 套 接 字 
inf loop: # 服务 器 无 限 循 环 

CS = ss.recvfrom()/ss.sendto()# 对 话 〈 接 收 与 发 送 ) 
ss.close() # 关闭 服务 器 套 接 字 


从 伪 代 码 中 可 以 看 出 ， 使 用 的 还 是 那 套 先 创建 套 接 字 然 后 绑 定 到 本 地 地 址 (主机 /端口 对 ) 的 
方法 。 无 限 循 环 中 包含 了 从 客户 端 接收 消息 ， 返 回 加 了 时 间 玲 的 结果 和 回去 等 下 一 个 消息 这 
三 步 。 同 样 的 ， 由 于 代码 不 会 跳出 无 限 循环 ， 所 以 ，close() 函 数 调用 是 可 选 的 。 我 们 写 这 一 
名 话 的 原因 是 要 提醒 读者 ， 在 设计 一 个 更 智能 的 退出 方案 的 时 候 ， 要 确保 close() 函 数 会 被 调 
用 。 


116.3 UDP ARIZ Z (tsUserv.py) 


创建 一 个 能 接收 客户 端 消 息 、 在 消息 前 加 一 个 时 间 惟 后 返回 的 UDP 服 务 器 。 


*!/usr/bin/env python 


from socket import * 


from time import ctime 


OO Ui A Ww N HP 


HOST-2'' 


7  FPORT-21567 

8 | BUFSIZ = 1024 

9 ADDR = (HOST, PORT) 

10 

11 udpSerSock = socket(AF INET, SOCK DGRAM) 
12 udpSerSock.bind (ADDR) 


13 

14 while True: 

15 print 'waiting for message...' 

16 data, addr = udpSerSock.recvfrom(BUFSIZ) 

17 udpSerSock.sendto('[*s] $s' $ ( 

18 ctime(), data), addr) 

19 print '...received from and returned to:', addr 
20 


21 udpSerSock.close() 


UDP 和 TCP 服 务 器 的 另 一 个 重要 的 区 别 是 ， 由 于 数据 报 套 接 字 是 无 连接 的 ， 所 以 无 法 把 客户 
端 连接 交 给 另外 的 套 接 字 进 行 后 续 的 通讯 。 这 些 服务 器 只 是 接受 消息 ， 需 要 的 话 ， 给 客户 端 
返回 一 个 结果 就 可 以 了 。 


例 16.3 的 tsUserv.py 是 之 前 那个 TCP 服 务 器 的 UDP 版 本 ， 它 接收 客户 端 消息 ， 加 时 间 改 后 返回 


1~4 行 


就 像 TCP 服 务 器 的 设置 那样 ， 在 Unix 的 启动 信息 行 后 ， 我 们 导入 了 time.ctime() 函 数 和 socket 
模块 的 所 有 属性 。 


6 ~ 12 行 


HOST 和 PORT 变量 与 之 前 完全 一 样 。socket() 函 数 的 调用 有 一 些 不 同 ， 我 们 现在 要 的 是 一 个 
数据 报 /UDP 的 套 接 字 类 型 。 不 过 bind() 有 函数 的 调用 方式 还 是 跟 TCP 版 本 的 一 样 。 同 样 地 ， 由 
于 UDP 是 无 连接 的 ， 就 不 用 调用 listen() 有 函数 来 监听 进来 的 连接 了 。 


14 ~ 21 行 


在 进入 到 服务 器 的 无 限 循环 后 ， 我 们 (被 动 地 ) 等 待 (数据 报 ) 消息 的 到 来 。 当 有 消息 进来 
时 ， 就 处 理 它 (EG dH BEA) ， 把 结果 返回 去 ， 然 后 再 去 等 待 下 一 个 消息 。 就 像 之 前 一 
样 ， 那 个 close() 函 数 只 是 一 个 演示 而 已 。 


16.3.7 ”创建 一 个 UDP 客户 端 


节 中 介绍 的 4 段 程序 中 ， 下 面 的 这 段 UDP 客户 端 代码 是 最 短 的 。 伪 代码 如 下 : 


cs = socket () # 创建 客户 端 套 接 字 

comm loop: # 通讯 循环 
cs.sendto()/cs.recvfrom() # 对 话 ( 发 送 / 接 收 ) 

cs.close() # 关闭 客户 端 套 接 字 


在 套 接 字 对 象 创 建 好 之 后 ， 我 们 就 进入 一 个 与 服务 器 的 对 话 循环 。 在 通信 结束 后 ， 套 接 字 就 
被 关闭 了 。tsUclnt.py 站 实 的 代码 在 例 16.4 中 给 出 。 


逐 行 解释 


还 是 跟 TCP 版 本 的 客户 端 一 样 ， 在 Unix 的 启动 信息 ， 我 们 导入 了 socket 模 块 的 所 有 属性 
5~ 10 行 

因为 我 们 的 服务 器 也 是 运行 在 本 机 ， 我 们 的 客户 端 还 是 使 用 本 机 和 相同 的 端口 号 。 自 然 地 ， 
缓冲 区 的 大 小 也 还 是 1K。 创 建 套 接 字 的 方法 跟 UDP 服 务 器 中 的 一 样 。 

12 ~ 22 行 


UDP 客户 端的 循环 基本 上 与 TCP 客 户 端的 完全 一 样 。 唯 一 的 区 别 就 是 ， 我 们 不 用 先 去 跟 UDP 
服务 器 而 是 直接 把 消息 发 送出 去 ， 然 后 等 待 服务 器 的 回复 。 得 到 加 了 时 间 惟 的 字 
符 串 后 ， 把 它 显示 到 屏幕 上 ， 然 后 再 继续 其 他 的 消息 。 在 输入 结束 后 ， 退 出 循环 ， 关 闭 套 接 
字 。 

例 16.4 UDP 时 间 惟 客户 端 (tsUcInt.py) 


创建 一 个 UDP 客 户 端 ， 程序 会 提示 用 户 输入 要 传 给 服务 器 的 信息 ， 显 示 服务 器 返回 的 加 了 时 
间 惟 的 结果 
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#!/usr/bin/env python 
from socket import * 
PORT-21567 


BUFSIZ = 1024 


1 

2 

3 

4 

5  HOST-' localhost ' 
6 

7 

8 ADDR = (HOST, PORT) 
9 


10 udpCliSock = socket(AF INET, SOCK DGRAM) 


LL 

12 while True: 

13 data = raw input('» ') 

14 if not data: 

15 break 

16 udpCliSock.sendto(data, ADDR) 
17 data, ADDR = udpCliSock.recvfrom(BUFSIZ) 
18 if not data: 

19 break 

20 print dataudpClisock.close() 
21 


22 udpCliSock.close() 


16.3.8 ”执行 UDP 服务 器 和 客户 端 
UDP 客户 端 与 TCP 客 户 端的 表现 类 似 : 


$ tsUclnt.py 

> hi 

[Sat Jun 17 19:55:36 2006] hi 

» spam! spam! spam! 

[Sat Jun 17 19:55:40 2006] spam! spam! spam! 
> 

$ 
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服务 器 也 差不多 : 


$ tsUserv.py 
waiting for message... 
.received from and returned to: UE TS0Z0 AX. I023) 


waiting for message.. 


我 们 输出 客户 端 信息 的 原因 是 ， 服 务 器 可 能 会 得 到 并 回复 多 个 客户 端 消息 ， 这 时 ， 输 出 就 可 
以 让 我 们 了 解 消息 来 自 哪里 。 S TTERRT E 说 ， 由 于 客户 端 会 创建 一 个 连接 ， 我 们 自然 
就 能 知道 消息 来 自 哪 里 。 注 意 ， 我 们 的 提示 信息 写 的 是 “waiting for message”(“ 等 待 消息 ”) 
而 不 是 “waiting for connection”(“ 等 待 连 — 。 


ap 


16.3.9 Socketiz £p 


除了 我 们 已 经 很 熟悉 的 socket.socket() 函 数 之 外 ，socket 模 块 还 有 很 多 属性 可 供 网 络 应 用 程序 
使 用 。 表 16.2 中 列 出 了 最 常用 的 几 个 。 
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3X 162 Socket 模块 属性 
届 性 名 池 mo £ 
数据 属性 
AF. UNIX, AF_INET, AF INET6* Python ERRORI eh SW 
fury CTCP 流 ，UDP ~ 数据 报 》 
TOR RS XI IPv6 的 布尔 型 标 直 

异常 
error 套 接 学 相关 错误 
herror" 主机 和 地 址 相关 的 错误 
gaicrror* 地 址 相关 的 错误 
timeout" 超时 
if 
socket() nome hb OK. dero MUR UUR T ETER (A) 
socketpair()* Within M. qm oe v ULM QE 7 EREEW9 3$. NE) 
fromfd() Wi—tG85mmmx ensem gem 
ssi“ (eftt Xe Tru eU BEC (SSL). REDE 
getaddrinfo) 得 到 地 址 信息 
getfqdn()" 返回 完整 的 域 的 名 字 
gethostname() 得 到 当前 主机 名 
gethostbyname() 由 主机 名 得 到 对 应 的 人 P 地 址 
gethostbyname_ex() gethostbyname(0) 的 扩展 版 本 ,返回 主机 名 、 主 机 所 有 的 别名 和 IP 地 址 列表 
gethostbyaddr() 出 人 P 地 址 得 到 DNS 信息 ， 返 回 一 个 类 似 gethostbyname. ex()ff) 3 元 组 
getprotobyname() 出 协议 各 《如 Acp') 得 到 对 应 的 号 码 
Betservbyname(Ygetservbypo() 由 服务 名 得 到 对 应 的 端口 号 或 反之 ， 两 个 圣 数 中 ， 协 议 名 都 是 可 选 的 
ntohlO/ntohs() 把 一 个 整 型 由 网 络 字 节 序 转换 为 主机 字 节 序 
htonl( yhtons() 把 一 个 整形 由 主机 字 节 序 转换 为 网 络 字 节 序 
inet aton(Yinet ntoa() 3E IP 659629 32 位 整 型 ， 或 反之 〈 仅 对 IJPv4 地 址 有 效 》 
inet. pton()/inet. ntop()" 把 号 地 址 转 为 二 进 制 格式 或 反之 〈 对 IPv4 和 lpw6 地 址 都 有 效 ) 
getdefaulttimceout()'setdefaulttimeout()" ` 得 到 /设置 默认 的 讲 接 字 超 时 时 间 ， 单 位 秒 〔 神 点 型 ) 

a. Python 22 新 增 。 

b. Python 2.3 新 增 

c. Python 24 新 增 。 

d. Python 1.6 Sft 

e. Python 2.0 ift. 


请 参考 《Python Library Reference》 中 socket 模 块 的 文档 以 了 解 更 多 的 信息 。 


16.4 *SocketServer 模 块 


SocketServer 是 标准 库 中 一 个 高 级 别 的 模块 。 用 于 简化 实现 网 络 客 户 端 与 服务 器 所 心 需 的 大 
量 样板 代码 。 该 模块 中 ， 已 经 实现 了 一 些 可 供 使 用 的 类 。 
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3X 16.3 SocketServer 模块 的 类 


» Hi 述 








伺 仿 服务 器 的 核心 功能 与 湾 合 (mix-in)〉 类 挂 多 这 个 类 内 用 于 深 生 ， 所 以 不 








BaseServer 会 生成 这 个 类 的 实例 ， 可 以 考 虚 使 用 TCPServer 和 UDPServer 

+ 
TCPServer/UDPServer WoKEmEWHPTCPUDP IN 9 28 

* 一 -— 
UnixStreamServer/ UnixDatagramServer 基本 的 基于 文件 同步 TCP/UDP 服务 器 








实现 了 核心 的 进程 化 或 钱 程 化 的 功能 ， 作 为 混合 类 ， 与 服务 器 类 一 并 使 用 以 


ForkingMixIn/ ThreadingMixIn 提供 一 些 异步 特性 ， 这 个 类 不 会 直 搜 实例 化 
TCU Ir TI TE: A VU AT " 








ForkingTCPServer/ ForkingUDPServer ForkingMixIn 和 TCPServcr/UDPServer 的 组 合 








ThreadingTCPServen ThreadingUDPServer ThreadingMixIn 和 TCPServer/UDPServer 的 组 合 








| 包含 处 理 服务 请 求 的 核心 功能 。 这 个 类 只 用 于 良 生 ， 所 以 不 会 生成 这 个 类 的 


eRe Handi ^ è 
Parsequethodir 实例 可 以 考虑 使 用 StreamRequestHandler 或 DatagramRequestHandler 


4 - 
StreamRequestHandler/ DatagramRequestHandler 用 于 TCP/UDP 服务 器 的 服务 处 理工 具 














我 们 将 再 次 实现 之 前 的 那个 基本 TCP 的 例子 ， 生 成 一 个 TCP 客 户 端 和 服务 器 。 你 会 注意 到 新 
实现 与 之 前 有 很 多 相似 之 处 ， 但 你 也 要 注意 到 ， 现 在 很 多 繁杂 的 事情 已 经 被 封装 好 了 ， 你 不 
用 再 去 关心 那个 样板 代码 了 。 例 子 给 出 的 是 一 个 最 简单 的 同步 服务 器 。 记 得 要 看 看 本 章 最 后 
的 把 服务 器 改 成 异步 的 习题 。 


为 了 要 隐藏 实现 的 细节 ， 我 们 现在 写 程序 时 会 使 用 类 ， 这 是 与 之 前 代码 的 另 一 个 不 同 。 用 面 
向 对 象 的 方法 可 以 帮助 我 们 更 好 的 组 织 数据 与 还 辑 功能 。 你 也 会 注意 到 ， 我 们 的 程序 现在 
是 “事件 驱动 * 了 。 这 就 意味 着 ， 只 有 在 事件 出 现 的 时 候 ， 程 序 才 有 "反应 ”。 


事件 包含 发 送 与 接收 数据 两 种 。 事 实 上 ， 你 会 看 到 ， 我 们 的 类 定义 中 只 包含 了 接收 客户 端 消 
息 的 事件 处 理 器 。 其 他 的 功能 从 我 们 所 使 用 的 SocketServer 继 承 而 来 。GUI 编 程 (第 19 章 ) 也 
是 事件 驱动 的 。 你 会 注意 到 有 一 个 相似 之 处 ， 即 在 代码 的 最 后 一 行 都 有 一 个 服务 器 的 无 限 循 
环 ， 等 待 并 处 理 客户 端 服务 请 求 。 本 章 之 前 创建 的 基本 TCP 服 务 器 也 有 一 个 类 似 的 无 限 while 
循环 。 


在 之 前 的 服务 器 循环 中 ， 我 们 阻塞 等 待 请 求 ， 有 请 求 来 的 时 候 就 处 理 请 求 ， 然 后 再 回去 继续 
等 待 。 现 在 的 服务 器 循环 中 ， 就 不 用 在 服务 器 里 写 代码 了 ， 改 成 定义 一 个 处 理 器 ， 服 务 器 在 
收 到 进来 的 请 求 的 时 候 ， 可 以 调用 你 的 处 理 函 数 。 


16.4.4 创建 一 个 SocketServerTCP 服 务 器 


在 代码 中 ， 先 导入 我 们 的 服务 器 类 ， 然 后 像 之 前 一 样 定义 主机 常量 。 主 机 常量 后 就 是 我 们 的 
请 求 处 理 器 类 ， 然 后 是 启动 代码 。 在 下 面 的 代码 片段 中 可 以 看 到 更 多 细节 。 


逐 行 解释 


最 开始 的 部 分 是 从 SocketServer 导 入 需要 的 类 。 注 意 ， 我 们 在 使 用 Python 2.4 的 多 行 导入 的 方 
式 o 如 果 你 使 用 老 版 本 的 Python ? 那么 你 要 使 用 模块 的 形 如 module.attribute 的 名 字 > 或 者 在 
导入 的 时 候 ， 把 代码 写 在 同一 行 里 : 


from SocketServer import TCPServer as TCP, StreamRequestHandler as SRH 


例 16.5  SocketServert IR] TCPk 4- 2$. (TsTservss.py) 


使 用 SocketServer €. 49 TCPServerfe StreamRequestHandler ž &| ££ — ^i HR TCP 服 务 


Xo 
1 #!/usr/bin/env python 
2 
3 from SocketServer import (TCPServer as TCP, 
á StreamRequestHandler as SRH) 
5 from time import ctime 
6 
7 HOST = '' 
8 PORT = 21567 
9 ADDR = (HOST, PORT) 
10 
11 class MyRequestHandler (SRH): 
12 def handle(self): 
13 print '...connected from:', self.client address 
14 self.wfile.write('[*s] $s' $ (ctime(), 
15 self.rfile.readline())) 
16 


17 tcpServ = TCP(ADDR, MyRequestHandler) 
18 print 'waiting for connection..." 


19 tcpServ.serve forever() 
11 ~ 1541 


主要 的 工作 在 这 里 。 我 们 从 SocketServer 的 StreamRequestHandler 类 中 派生 出 一 个 子 类 ， 并 
重 写 handle() 函 数 。 在 BaseRequest 类 中 ， 这 个 函数 因 没 有 默认 动作 而 被 中 断 : 


def handle(self): 


pass 


在 有 客户 消息 进来 的 时 候 ，handle() 有 函数 就 会 被 调用 。StreamRequestHandler 类 支持 像 操 作 
文件 对 象 那样 操作 输入 输出 套 接 字 。 我 们 可 以 用 readline() 函 数 得 到 客户 消息 ， 用 write() 函 数 
把 字符 串 发 给 客户 端 。 


为 了 保持 一 臻 性， 我们 要 在 客户 端 与 服务 器 两 端的 代码 里 都 加 上 回 车 与 换行 。 实 际 上 ， 你 在 
代码 中 看 不 到 这 个 ， 因 为 ， 我 们 重用 了 客户 端 传 过 来 的 回 车 与 换行 。 除 了 这 些 我 们 刚刚 说 到 
的 不 同 之 处 外 ， 代 码 看 上 去 与 之 前 的 那个 服务 器 是 一 样 的 。 


17 ~ 19 行 


代码 的 最 后 部 分 用 给 定 的 主机 信息 和 请 求 处 理 类 创建 TCP 服 务 器 。 然 后 进入 等 待 客户 端 请 求 
与 处 理 客 户 请 求 的 无 限 循环 中 。 


16.4.2 ”创建 SocketServerTCP 客 户 端 


很 自然 地 ， 我 们 的 客户 端 与 之 前 的 客户 端的 代码 很 相似 ， 比 服务 器 还 相似 得 多 。 但 客户 端 要 
做 一 些 相 应 的 调整 以 适应 新 的 服务 器 。 


R4 AE 

1~8 行 

没什么 特别 的 ， 与 原来 的 客户 端 代码 完全 相同 。 

例 16.6 SocketServerH H RTCP P 3$ (tsTcIntSS.py) 


这 是 一 个 时 间 惟 TCP 客 户 端 ， 它 知道 如 何 与 类 似 于 文档 的 SocketServer 里 StreamRequest 
Handler 对 象 进行 通讯 。 


#!/usr/bin/env python 


from socket import * 


PORT=21567 
BUFSIZ = 1024 


1 
2 
3 
4 
5  HOST-' localhost ' 
6 
7 
8 ADDR - (HOST, PORT) 


9 

10 while True: 

11 tcpCliSock = socket(AF INET, SOCK STREAM) 
12 tcpCliSock.connect (ADDR) 

13 data = raw input('» ') 

14 if not data: 

15 break 

16 tcpCliSock.send('$sMrMn' $% data) 
17 data = tcpCliSock.recv (BUFSIZ) 
18 if not data: 

19 break 

20 print data.strip() 

21 tcpCliSock.close() 


10 ~ 21 行 


SocketServer 的 请 求 处 理 器 的 默认 行为 是 接受 连接 ， 得 到 请 求 ， 然 后 就 关闭 连接 。 这 使 得 我 
们 不 能 在 程序 运行 时 ， 一 直 保 持 连 接 状态 ， 而 是 每 次 发 送 数据 到 服务 器 的 时 候 都 要 创建 一 个 
新 的 套 接 字 。 


这 种 行为 使 得 TCP 服 务 器 的 行为 有 些 像 UDP 服务 器 。 不 过 ， 这 种 行为 也 可 以 通过 重 写 请 求 处 
理 器 中 相应 的 函数 来 改变 。 我 们 把 这 个 留 在 本 章 最 后 的 练习 中 。 


现在 ， 我 们 的 客户 端 有 点 完全 不 一 样 了 (我们 得 每 次 都 创建 一 个 连接 ) 。 其 他 的 小 区 别 在 服 
务 器 代码 的 逐 行 解释 中 已 经 看 到 了 : 我 们 使 用 的 处 理 器 类 像 文 件 一 样 操作 套 接 字 ， 所 以 我 们 
每 次 都 要 发 送行 结束 字符 (〈 回 车 与 换行 ) 。 服 务 器 只 是 保留 并 重用 我 们 发 送 的 行 结束 字符 。 
当 我 们 从 服务 器 得 到 数据 的 时 候 ， 我 们 使 用 strip() 函 数 去 掉 它 们 ， 然 后 使 用 print 语 名 自动 提供 

的 回 车 。 
16.4.3 ”执行 TCP 服 务 器 和 客户 端 
下 面 是 我 们 SocketServer TCP 客 户 端的 输出 : 


$ tsTclntSS.py 

» 'Tis but à scratch. 

[Tue Apr 18 20:55:49 2006] 'Tis but a scratch. 
» Just a flesh wound. 


[Tue Apr 18 20:55:56 2006] Just a flesh wound. 
> 


下 面 是 服务 器 Ei 的 输 出 : 


$ tsTservSS.py 
waiting for connection... 


.GCoónnécted from: ['127.0.0.1', 534796) 
.Connected from: ('127.0.0.1', 53477) 


输出 与 我 们 之 前 的 TCP 客 户 端 与 服务 器 相似 。 不 过 ， 你 能 看 到 ， 我 们 连接 了 服务 器 两 次 。 


16.5 TwistedE 4 ^| 28 


Twisted 是 一 个 完全 事件 驱动 的 网 络 框架 。 它 允许 你 使 用 和 开发 完全 异步 的 网 络 应 用 程序 和 协 
议 。 在 写本 书 的 时 候 ， 它 还 不 是 Python 标准 库 的 一 部 分 ， 要 使 用 它 ， 你 必须 另外 下 载 并 安装 
€ (在 本章 最 后 能 找到 链接 ) 。 它 为 你 创建 一 个 完整 系统 提供 了 很 大 的 帮助 。 系 统 中 可 以 
有 : 网 络 协议 、 线 程 、 安 全 和 认证 、 聊 天 /即时 通讯 、 数 据 库 管理 、 关 系数 据 库 集成 、 
Wed/Internet、 电 子 邮件 、 命 令 行 参数 、 图 形 界面 集成 等 。 


使 用 Twisted 来 实现 我 们 这 个 简单 的 例子 有 牛刀 杀 鸡 的 感觉 。 不 过 ， 学 东西 总 要 有 切入 点 吧 ， 
我 们 先 实现 一 个 “Hello World” 的 网 络 应 用 程序 。 


像 SocketServer 一 样 ，Twisted 的 大 部 分 功能 都 在 它 的 类 里 面 。 在 我 们 的 例子 中 ， 我 们 将 使 用 
Twisted 的 Internet 组 件 中 reactor 和 protocol 包 的 类 。 


16.5.4 创建 一 个 Twisted Reactor TCP 服 务 器 


你 会 发 现 我 们 的 代码 与 SocketServer 例 子 有 些 相 似 。 我 们 创建 一 个 协议 类 ， 并 像 安 装 回 调 函 
数 那样 重 写 几 个 函数 ， 而 不 是 写 一 个 处 理 器 类 。 同 样 的 ， 我 们 的 例子 是 异步 的 。 先 来 看 服务 


一 开始 的 代码 照常 是 模块 导入 部 分 。 要 注意 twisted.internet 中 protocol 和 reactor 包 和 端口 号 党 


时- 
o 


EA 
8-144 


我 们 从 Protocol 类 中 派生 出 TSServProtocol 类 作为 时 间 改 服务 器 。 然 后 重 写 connectionMade() 
函数 ， 这 个 函数 在 有 客户 端 连接 的 时 候 被 调用 ， 以 及 dataReceived() 函 数 ， 这 个 函数 在 客户 端 
通过 网 络 发 送 数 据 过 来 时 被 调用 。reactor 把 数据 当成 参数 传 到 这 个 函数 中 ， 这 样 我 们 就 不 用 
自己 去 解析 数据 了 。 


116.7 Twisted Reactor 时 间 稚 服务 器 (tsTservTW.py) 


这 是 一 个 使 用 Twisted Internet3 8 &T IR] EXTCPJAR. 4-25 ° 


` 
3 from twisted.internet import protocol, reactor 
from tir import me 
ORT = 2 
8 class TSServProtocol(protocol.Protocol): 
9 def connectionMade (self): 
clnt = self.clnt = self.transport.getPeer().host 
11 print '...connected from:', clnt 
12 def dataReceived(self, data): 
13 self.transport.write('[*s] *s' *& ( 
stime (), data)) 
6 fa y protocol.Factory() 
l à prot TSServProt 


18 print 'waiting for connection..." 


19 reactor.listenTCP(PORT, factory) 


我 们 通过 transport 实 例 对 象 与 客户 端 进行 通信 。 你 可 以 看 到 在 connectionMade() 函 数 中 ， 我 
们 如 何 得 到 主机 的 信息 ， 以 及 在 dataReceived() 有 函数 中 ， 我 们 如 何 把 数据 传 回 客 户 端 。 


16 ~ 20 行 


在 服务 器 的 最 后 一 部 分 ， 我 们 创建 一 个 protocol Factory()。 它 被 称 为 “工厂 "是 因为 ， 每 次 我 们 
有 连接 进来 的 时 候 ， 它 都 会 “生产 "一 个 我 们 的 protocol 对 象 。 然 后 在 reactor 中 安装 一 个 TCP 监 
听 器 以 等 待 服务 请 求 。 当 有 请 求 进 来 时 ， 创 建 一 个 TSServProtocol 实 例 来 服务 那个 客户 端 
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5 SocketServer TCP 客 户 端 不 一 样 的 是 ， 这 个 例子 与 之 前 的 所 有 其 他 客户 端 看 上 去 都 不 大 一 
样 。 它 是 完全 Twisted 的 。 


例 16.8 Twisted Reactor Timestamp TCP 客 户 端 (tsTcIntTW.py) 


A Twisted € 5 4&1] €, 22 31 ;& 5 t| T8] EXT CP E P 38 


3 from twisted.inter net import prot l, reactor 
HOST=' 1 alhos 
6 RT-21567 
8 class TSClntProt l(pro Pr col) 
def sendData(se 
data "aw ( ) 

1 if data 

12 print '...sending $s...' $ data 

13 self.transport.write(data) 

B else 

15 se ansport se e nt) 

16 

17 def connectionMade (self): 

18 self.sendData() 

["] 

0 def dataReceived(self, data): 

print data 

22 self.sendData () 

? 14 

/4 class TSCintFactory(prot i Factory) 

p ocol TSClnt 

entConne ionLost itConnectionFailed 

7 lambda se e r r tor.stop() 
28 

9 reactor.con TCP (HOS RT, TSCl à )) 
j reac ( 
逐 行 解释 
1~6 行 


跟 之 前 所 有 的 客户 端 程序 类 似 ， 这 里 还 是 导入 Twisted 的 组 件 。 
8 ~ 22 行 


与 服务 器 一 样 ， 我 们 扩展 Protocol， 重 写 同 样 的 函数 connectionMade() 和 dataReceived()。 这 
两 个 防 数 的 用 途 也 跟 服 务 器 一 样 。 我 们 新 加 一 个 自己 的 函数 sendData()， 用 于 在 需要 发 送 数 
据 时 调用 。 


由 于 我 们 现在 是 客户 端 ， 所 以 我 们 要 主动 发 起 跟 服务 器 的 对 话 。 一 旦 连接 建立 好 之 后 ， 我 们 
先 发 送 一 个 消息 ， 服 务 器 回复 这 个 消息 ， 我 们 把 收 到 的 回复 显示 在 屏幕 上 ， 然 后 再 发 送 其 他 
消息 给 服务 器 。 


DNE] 


这 个 过 程 会 一 直 循 环 ， 直 到 用 户 没有 给 任何 输入 时 ， 连 接 结束 。 结 束 时 ， 就 不 是 调用 
transport 对 象 的 write() 函 数 传 数据 给 服务 器 了 ， 而 是 调用 loseConnection() 有 函数 来 关闭 套 接 
字 。 这 时 ， 工 厂 的 clientConnectionLost() 函 数 会 被 调用 ， 同 时 ，reactor 就 被 关闭 ， 脚 本 的 执 
行 就 结束 了 。 由 于 某 些 原因 ，clientConnectionFailed() 被 调用 时 ，reactor 也 会 被 关闭 。 


脚本 的 最 后 一 部 分 是 创建 一 个 客户 端 工 厂 ， 连 接 到 服务 器 ， 然 后 运行 reactor。 注 意 ， 我 们 在 
这 里 实例 化 了 客户 端 工厂 ， 而 不 是 像 在 服务 器 里 那样 把 它 传 到 reactor 中 。 这 是 因为 ， 我 们 不 
是 等 待 客户 端 连接 的 服务 器 ， 服 务 器 在 有 连接 时 要 为 每 个 连接 创建 一 个 新 的 protocol 对 象 。 我 
们 只 是 一 个 客户 端 ， 所 以 我 们 只 要 创建 一 个 protocol 对 象 ， 连 接 到 服务 器 ， 服 务 器 的 工厂 会 创 
建 一 个 protocol 对 象 来 与 我 们 对 话 。 


16.5.3 ”执行 TCP 服 务 器 和 客户 端 
Twisted 客 户 端 显示 的 内 容 与 我 们 之 前 的 客户 端 类 似 : 


$ tsTclntTW.py 
» Where is hope 
.. Sending Where is hope... 
[Tue Apr 18 23:53:09 2006] Where is hope 
» When words fail 
. Sending When words fail... 
[Tue Apr 18 23:53:14 2006] When words fail 
> 


$ 


服务 器 又 回 到 了 只 有 一 个 连接 的 情况 。Twisted 维 护 连接 ， 不 会 在 每 个 消息 后 都 关 transport » 


$ tsTservTW.py 
waiting for connection... 


...Connected from: 127.0.0.1 


"connection from” 输 出 没有 其 他 的 信息 ， 因 为 我 们 只 向 服务 器 的 transport 对 象 的 getPeer() 函 数 
要 了 主机 /地 址 的 信息 。 


16.6 相关 模块 


表 16.4 列 出 了 其 他 与 网 络 和 套 接 字 相关 的 Python 模 块 。select 模 块 通常 在 底层 套 接 字 程序 中 与 
socket 模 块 联合 使 用 。 它 提供 的 select() 辑 数 可 以 同时 管理 多 个 套 接 字 对 象 。 它 最 有 用 的 功能 
就 是 同时 监听 多 个 套 接 字 的 连接 。select() 亟 数 会 阻塞 ， 直 到 有 至 少 一 个 套 接 字 准备 好 要 进行 
通讯 的 时 候 才 退出 。 它 提供 了 哪些 套 接 字 已 经 准备 好 可 以 开始 读 取 的 集合 ( 它 也 能 决定 了 哪 
些 套 接 字 已 经 准备 好 可 以 开始 写 的 集合 ， 不 过 这 个 功能 相对 来 说 不 大 常用 ) o 
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K 16.4 网 络 / 套 接 字 编 程 相关 模块 
横 x d 3 
socket | 底层 网 络 接口 ， 本 章 讨 论 过 
i asyncore/ asynchat | hie» p AERER PITAR ILLAS 
Select 在 单线 程 网 阁 服务 器 程序 中 ， 管 理 多 个 奔 接 字 连 接 
SocketServer utr 为 网络 疫 用 程序 提供 度 务 器 的 高 级 别 模块 ， 还 提供 各 种 进程 和 线程 的 版 本 





async* 和 SocketServer 模 块 在 创建 服务 器 方面 都 提供 了 高 层次 的 功能 。 由 于 是 基于 socket 和 

(或 ) select 模 块 ， 了 所 有 的 底层 的 代码 ， 它 们 使 你 可 以 快速 开发 客户 端 /服务 器 的 系统 。 
你 所 需要 做 的 只 是 从 适当 的 基 类 中 派生 出 一 个 新 的 类 。 所 有 的 东西 就 已 经 就 绪 了 。 就 像 之 前 
所 说 的 ，SocketServer 甚 至 提供 了 把 线程 或 进程 集成 到 服务 器 中 的 功能 ， 以 实现 更 好 的 对 客 
户 端 请 求 的 并 行 处 理 能 力 。 


虽然 async* 是 标准 库 提供 的 唯一 的 异步 开发 支持 库 ， 我 们 也 可 选择 如 Twisted 这 样 相 对 于 标准 
库 更 现代 、 更 强大 的 第 三 方 库 。 虽 然 这 里 看 到 的 例子 代码 比 之 前 的 什么 都 自己 处 理 的 代码 稍 
微 长 那么 一 点 ，Twisted 提 供 了 更 为 强大 、 更 具 弹 性 的 框架 。 它 已 经 实现 了 很 多 协议 。 你 可 以 
在 下 面 的 网 站 找到 更 多 有 关 Twisted 的 信息 : 


http://twistedmatrix.com 


本 章 所 讨论 的 主题 涵盖 了 在 Python 中 用 socket 网 络 编程 和 如 何 用 低级 别 的 协议 如 TCP/IP 和 
UDP/IP 来 创建 应 用 程序 。 如 果 你 想 要 开发 高 层次 的 网 页 和 因特网 应 用 程序 ， 强 烈 建议 你 阅读 
第 17 章 和 第 20 章 。 


16.7 练习 


16-1. 套 接 字 。 面 向 连接 和 无 连接 有 什么 
16-2. 客 户 端 /服务 器 架构 。 用 你 自己 的 语言 描述 这 个 架构 ， 并 给 出 几 个 例子 。 


16-3. 套 接 字 。TCP 和 UDP 中 ， 哪 一 种 服务 器 在 接受 连接 后 ， 把 连接 交 给 不 同 的 套 接 字 处 
理 与 客户 端的 通讯 。 


16-4. 客 户 端 。 修改 TCP (tsTclnt.py) 和 UDP (tsUcInt.py) 客户 端 ， 让 服务 器 的 名 字 不 
要 在 代码 里 写 死 ， 要 允许 用 户 指 定 一 个 主机 名 和 端口 ， 只 有 在 两 个 值 都 没有 输入 的 时 候 
才 使 用 默认 值 。 


16-5. 网 络 互 联 和 套 接 字 。 找 到 《Python Library Reference》 中 7.2.2 节 Guido van 
Rossum 的 示例 TCP 客 户 端 /服务 器 程序 ， 实 现 它 并 让 它 运行 起 来 。 先 运行 服务 器 ， 然 后 
是 客户 端 。 源 代码 的 一 个 在 线 版 本 可 以 在 这 里 找到 : 


http://www.python.org/doc/current/lib/ Socket Example.html 
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你 认为 这 个 服务 器 太 无 聊 了 ， 决 定 要 修改 服务 器 ， 让 它 能 识别 以 下 命令 : 


date 服务 器 将 返回 它 的 当前 时 间 ， 邮 time.ctime(time.time()) 
os 得 到 操作 系统 的 信息 Cos. name) 
ls 得 到 当前 目录 的 文件 列表 (提示; os .1istdixr1() 可 以 得 到 目录 列表 ，os .curdir 能 得 到 当前 


目录 ) 。 附 加 题 ， 要 能 接受 “1s dir” 指 令 ， 并 返回 dir 目录 的 文件 列表 。 


做 这 个 作业 的 时 候 ， 你 不 一 定 要 有 网 络 你 的 机 器 可 以 跟 自 己 通讯 。 注 : 在 服务 
器 退出 后 ， 要 清除 绑 定 后 才能 再 次 运行 。 否 则 ， 有 可 能 得 碰 到 "端口 已 经 被 使 

用 ”(“port already bound") 的 错误 信息 。 操 作 系 统一 般 会 在 5 分 钟 内 清除 绑 定 。 所 
以 ， 请 耐心 等 待 。 





16-6. 日 期 时 间 服 务 。 使 用 Socket.getservbyname() 函 数 得 到 UDP 协议 中 "daytime" 服 务 所 
对 应 的 端口 。 请 参考 getservbyname() 有 函数 的 文档 ， 查 阅 如 何 使 用 的 详细 语法 。《〈 即 : 
socket.getservbyname. doc ) 。 现 在 ， 写 一 个 程序 发 送 一 个 随便 什么 数据 过 去 ， 等 
待 回 答 。 一 旦 你 收 到 了 服务 器 的 信息 ， 显 示 到 屏幕 上 。 


16-7. 半 双 工 聊天 。 创 建 一 个 简单 的 半 双 工 聊 天 程序 。“ 半 双 工 ”的 意思 是 当 创建 一 个 连 
接 ， 服 务 启 动 的 时 候 ， 只 有 一 个 人 可 以 打字 ， 另 一 个 人 只 有 在 等 到 有 消息 通知 他 输入 消 
息 时 ， 才 能 说 话 。 一 旦 消息 发 送出 去 后 ， 要 等 到 有 回复 了 才能 发 送 下 一 条 消息 。 一 个 人 
是 服务 端 ， 另 一 个 人 是 客户 端 。 


16-8. 全 双 工 聊天 。 人 和 修改 你 刚才 的 程序 ， 改 成 全 双 工 ， 即 两 个 人 可 以 独立 地 发 送 和 接收 消 
B s 


AX 


16-9. 多 用 户 全 双 工 聊天 。 再 次 修改 你 的 程序 ， 把 聊天 服务 改 成 支持 多 用 户 版 本 。 
16-10. 多 用 户 、 多 房间 全 双 工 聊天 。 现 在 把 聊天 服务 改 成 支持 多 个 用 户 、 多 个 房间 。 


16-11. 网 页 客户 端 。 写 一 个 TCP 客 户 端 ， 连 到 你 最 喜欢 的 网 站 的 80 端 口 〈 去 掉 “http:/" 和 
其 他 的 后 组 信息 ， 只 用 主机 名 ) 。 一 旦 创建 了 一 个 连接 ， 发 送 HTTP 命 令 字符 

串 “GETAn”， 把 服务 器 返回 的 所 有 数据 写 到 一 个 文件 中 (GET 命令 用 于 得 到 网 页 PR 
示 要 得 到 的 文件 ，An" 把 命令 发 送 到 服务 器 ) 。 检 查 得 到 的 文件 的 内 容 ， 它 是 什么 ? 怎么 
检查 你 得 到 的 数据 是 否 正确 ? ( 注 : 你 可 能 要 在 命令 后 加 一 个 或 是 两 个 回 车 ， 一 般 来 
说 3 二 个 就 可 以 了 ) o 


16-12. 休 眠 服务 器 。 创 建 一 个 “休眠 "服务 器 ， 客 户 端 可 以 要 求 要 “休眠 ” 几 秒 钟 。 服 务 器 就 
去 做 休 眼 的 操作 。 休 眠 结束 后 ， 返 回 一 个 消息 给 客户 端 表示 结束 。 客 户 端 在 收 到 消息 
的 时 候 应 该 刚好 等 待 了 指定 的 时 间 。 这 就 是 一 个 简单 的 “远程 过 程 调 用 ”(“remote 
procedure call") ， 即 客户 端 发 送 一 个 指令 ， 网 络 另 一 边 的 远程 的 机 器 执行 这 个 命令 。 
16-13. 名 字 服 务 器 。 设 计 并 实现 一 个 名 字 服 务 器 。 这 个 服务 器 负责 维护 一 个 主机 名 一 端 
口号 对 的 数据 库 ， 以 及 一 个 描述 这 个 服务 器 提供 的 服务 的 字符 串 。 选 择 一 个 或 几 个 服务 
器 到 你 的 名 字 服 务 器 上 “注册 ”( 注意 ， 这 时 ， 这 些 服 务 器 是 名 字 服 务 器 的 客户 端 ) 。 每 一 
个 客户 端 在 启动 的 时 候 ， 都 不 知道 它们 想 要 找 的 服务 器 的 信息 。 名 字 服 务 器 的 客户 端 也 
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CO TOMUS 服务 。 名 
字 服 务 器 返回 一 个 主机 名 一 端口 号 对 给 客户 端 ， 客 户 端 这 时 就 可 以 连 到 合适 的 服务 器 来 


处 理 它 的 请 求 。 
附加 题 : 
(1) 在 名 字 服 务 器 中 ， 加 入 对 常用 请 求 的 缓冲 。 


(2) 在 名 字 服 务 器 中 ， 加 入 日 志 功 能 ， 记 录 下 哪个 服务 器 注册 了 ， 客 户 端 在 请 求 哪 
一 个 服务 


(3) 名 字 服 务 器 应 该 周期 pd 些 注 册 了 的 服务 器 的 对 应 端口 号 ， 以 确定 这 
些 服务 器 还 在 运行 中 。 在 连续 数 次 ping 失 败 后 ， 就 把 这 i o 


" 
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服务 (它们 根本 不 对 请 求 做 应 答 ) 。 


16-14. 错 误 检查 和 优雅 地 退出 。 本 章 中 ， 我 们 所 有 客户 端 和 服务 器 的 例子 代码 都 没有 做 
错误 检查 。 我 们 没有 检查 用 户 是 否 按 下 了 ^C 来 退出 服务 ， 或 ^DD 来 结束 客户 输入 ， 也 没有 
检查 raw_input() 函 数 得 到 的 输入 的 合法 性 ， 也 没有 检查 网 络 错误 。 由 于 这 些 弱点 ， 我 们 
很 可 能 会 在 退出 程序 的 时 候 ， 没 有 关闭 套 接 字 ， 也 有 可 能 会 丢失 数据 。 选 择 一 对 客户 端 / 
服务 器 例子 ， 加 入 足够 的 错误 检查 ， 让 程序 能 正常 退出 。 比 方 说 会 关闭 网 络 连接 。 


16-15. 异 步 和 SocketServer。 选 取 TCP 服 务 器 例子 ， 使 用 某 一 个 混合 类 (mix-in ) ， 让 你 
的 程序 成 为 一 个 异步 服务 器 。 测 试 你 的 服务 器 ， 创 建 并 同时 运行 多 个 客户 端 ， 在 服务 器 
的 输出 里 查看 你 的 服务 器 是 否 在 同时 响应 多 个 请 求 。 

16-16.* 扩 PAOK ENE » f&SocketServer TCP 服 务 器 代码 中 ， 我 们 不 能 使 用 原来 的 
TCP X P 3 » 要 做 修改 。 这 是 因为 SocketServer 类 在 多 个 请 求 之 间 不 保持 连接 。 


(a) 从 TCPServer 和 StreamRequestHandler 中 派生 出 新 的 类 ， 重 新 设计 服务 器 的 
架构 ， 让 服务 器 能 为 每 个 客户 端 只 使 用 一 个 连接 (而 不 是 每 个 请 求 一 个 连接 ) o 


(b) 把 前 一 个 问题 的 解决 方案 应 用 到 a) 部分， 让 多 个 客户 端的 请 求 可 以 被 并 行 
地 处 理 。 
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本 章 主题 


guy 


4 5l 
4 文件 传输 

e 文件 传输 协议 (FTP) 

4 网 络 新 闻 、Usenet 和 新 闻 组 
4 网 络 新 闻 传输 协议 (NNTP) 
e 电子 邮件 

e 简单 邮件 传输 协议 (SMTP) 
e 邮局 协议 3 (POP3 ) 

e. 相关 模块 


在 之 前 的 章节 中 ， 我 们 已 经 大 致 了 解 了 那些 使 用 套 接 字 的 低级 别 的 网 络 通讯 协议 。 这 种 网 络 
互 连 是 当今 互联 网 中 大 部 分 客户 端 /服务 器 协议 的 核心 。 这 些 网 络 协 议 包 括 文件 传输 
(FTPSCP 等 ) 、 阅 读 Usenet 新 闻 组 (NNTP) 、 电 子 邮 件 发 送 (SMTP) 、 从 服务 器 上 下 载 
电子 邮件 (POP3,IMAP ) 等 。 这 些 协议 的 工作 方式 与 之 前 在 套 接 字 编 程 中 介绍 的 客户 端 /服务 
器 的 例子 很 像 。 唯 一 的 不 同 在 于 ， 我 们 已 经 使 用 过 TCP/IP 等 低级 别 的 协议 ， 并 基于 此 创建 了 
新 的 ， 更 具体 的 协议 来 实现 我 们 刚刚 描述 的 服务 。 


17.4 什么 是 因特网 客户 端 


在 着 手 研究 这 些 协 议 之 前 ， 我 们 要 先 问 一 个 问题 :“ 因 特 网 客户 端 到 底 是 什么 ? "要 回答 这 个 问 
题 ， 我 们 把 因特网 简化 成 一 个 数据 交换 中 心 ， 数 据 交 换 的 参与 者 是 一 个 服务 提供 者 和 一 个 服 
务 的 使 用 者 。 有 的 人 把 它 称 为 “生产 者 一 消费 者 ”( 虽然 这 个 词 一 般 只 用 在 讲解 操作 系统 相关 信 
AH) 。 服 务 器 就 是 生产 者 ， 它 提供 服务 ， 一 般 只 有 一 个 服务 器 (进程 或 主机 等 ) 和 多 个 消 
费 者 ， 就 像 我 们 之 前 看 的 客户 端 / 服 务 器 模型 那样 。 虽 然 现在 我 们 不 再 使 用 低级 别 的 套 接 字 来 
创建 因特网 客户 端 但 模型 是 完全 相同 的 。 


这 里 ， 我 们 将 详细 了 解 三 个 网 际 协议 一 一 FTP、NNTP 和 POP3， 并 写 出 它们 的 客户 端 程序 。 
通过 这 些 程序 ， 你 将 会 发 现 这 些 协议 的 API 是 多 么 的 相似 由 于 保持 接口 的 一 致 性 有 很 大 的 
好 处 ， 所 以 ， 这 些 相 似 性 在 设计 之 初 就 考虑 到 了 一 一 更 重要 的 是 ， 你 还 能 学 会 如 何 写 出 这 些 
协议 与 其 他 协议 实用 的 客户 端 程序 来 。 虽 然 我 们 只 着 重 说 了 这 三 个 协议 在 看 完 这 些 协议 后 ， 

你 就 能 有 足够 的 信心 和 能 力 写 出 任何 网 际 协议 的 客户 端 程序 了 。 





17.2 文件 传输 


17.2.1 文件 传输 网 际 协 议 


因特网 中 最 流行 的 事情 就 是 文件 的 交换 。 文 件 交 换 无 处 不 在 。 有 很 多 协议 可 以 供 因 特 网 上 传 
输 文件 使 用 。 最 流行 的 有 文件 传输 协议 (File Transfer Protocol, FTP) 、Unix-to-Unix 复 制 协 
it (Unix-to-Unix GopyProtoral; UUCP) 和 网 页 的 超 文本 传输 协议 (Hypertext Transfer 
Protocol, HTTP) 。 另 外 ， 还 有 (Unix 下 的 ) 远程 文件 复制 指令 rcp (以 及 更 安全 、 更 灵活 的 
scp 和 rsync) 。 


迄今 为 止 ，HTTP、FTP 和 scp/rsync 还 是 非常 流行 的 。HTTP 主 要 用 于 网 页 文件 的 下 载 和 访问 
Web 服 务 上 。 它 一 般 不 要 求 用 户 输入 登录 的 用 户 名 密码 就 可 以 访问 服务 器 上 的 文件 和 服务 
HTTP 文 件 传 输 请 求 主要 是 用 于 获取 网 页 (文件 下 载 ) 。 


相对 的 ，scp 和 rsync 要 求 用 户 登 录 到 服务 器 ， 否 则 不 能 上 传 或 下 载 文 件 。 至 于 FTP， 跟 
scp/rsync 一 样 ， 可 以 上 传 或 下 载 文 件 ， 还 采用 了 Unix 的 多 用 户 的 概念 ， 用 户 一 定 要 输入 有 效 
的 用 户 名 和 密码 才能 使 用 。 不 过 ，FTP 也 允许 匿名 登录 。 接 下 来 ， 我 们 先 仔细 看 看 FTP 。 


17.2.2 文件 传输 协议 (FTP) 


文件 传输 协议 由 已 故 的 Jon Postel (作者 这 里 使 用 的 Jon 是 Jonathon 的 简写 ， 下 文中 会 使 用 全 
名 ) 和 Joyce Reynolds 开 发 ， 记 录 在 RFC (Request for Comment) 959 号 文档 中 ， 于 1985 
年 10 月 发 布 ， 主 要 用 于 匿名 下 载 公共 文件 。 也 可 以 用 于 在 两 台电 脑 之 间 传 输 文件 ， 尤 其 是 在 
使 用 Unix 系 统 作为 文件 存储 系统 ， 使 用 其 他 机 器 来 工作 的 情况 。 旱 在 网 络 流行 之 前 ，FTP 就 是 
在 因特网 上 文件 传输 、 软 件 和 源 代码 下 载 的 主要 手段 之 一 。 


FTP 要 求 输入 用 户 名 和 密码 才能 访问 远程 的 FTP 服 务 器 ， 但 它 也 允许 没有 账号 的 用 户 以 匿名 用 
户 登 录 。 不 过 ， 管 理 员 要 先 设置 FTP 服 务 器 允许 匿名 用 户 登 录 。 这 时 ， 匿 名 用 户 的 用 户 名 
是 “匿名 ”(anonymous) ， 密 码 一 般 是 用 户 的 电子 邮件 地 址 。 与 特定 的 用 户 拥 有 特定 的 账户 不 
同 ， 这 有 点 像 是 把 FTP 公 开 出 来 让 大 家 访问 。 匿 名 用 户 通过 FTP 协 议 可 以 使 用 的 命令 与 一 般 的 
用 户 相 比 来 说 ， 限 制 更 多 。 


图 17-1 展 示 了 这 个 协议 ， 其 工作 流程 如 下 : 
1. 客 户 端 连接 远程 的 FTP 服 务 器 ; 

客户 端 输入 用 户 名 和 密码 (或 “匿名 "和 电子 邮件 地 址 ) 
3. 客 户 端 做 各 种 文件 传输 和 信息 查询 操作 ; 


4. 客 户 端 登 出 远程 FTP 服 务 器 ， 结 束 通讯 。 





etricmd 
M (» 1023) 
21 
FTP FTP server 
Ez data Internet (Active) (Passive) d ] 
M+1 | 20 or 
N (» 1023) 











图 17-1 因特网 上 的 FTP 客 户 端 和 服务 器 。 客 户 端 和 服务 器 使 用 指令 和 控制 端口 发 送 
FTP 协 议 ， 而 数据 通过 数据 端口 传输 。 


当然 ， 这 只 是 一 个 大 致 流程 。 有 时 ， 由 于 网 络 两 边 电 脑 的 前 溃 或 是 网 络 的 问题 ， 会 导致 整个 
事务 在 完成 之 前 被 中 断 。 一 般 在 客户 端 超过 15 分 钟 (900 秒 ) 不 活动 之 后 ， 连 接 就 会 被 关闭 。 


在 底层 上 ， Eee rm ee ol ， FTP 是 客 
户 端 /服务 器 编程 中 很 “与 众 不 同 " 的 例子 。 客 户 端 和 服务 器 都 使 用 两 个 套 接 字 来 通讯 : 一 个 是 
控制 和 命令 端口 (21 号 端口 ) ， 另 一 个 是 数据 端口 (有 时 是 20 号 端口 ) 。 


我 们 说 “有 时 ?是 因为 FTP 有 两 种 模式 : 主动 和 被 动 。 只 有 在 主动 模式 服务 器 才 使 用 数据 端口 。 
在 服务 器 把 20 号 端口 设置 为 数据 端口 后 ， 它 “主动 "连接 客户 端的 数据 端口 。 而 被 动 模式 中 ， 服 
务 器 只 是 告诉 客户 端 它 的 随机 端口 的 号 码 ， 客 户 端 必须 主动 建立 数据 连接 。 在 这 种 模式 下 ， 

你 会 看 到 ，FTP 服 务 器 在 建立 数据 连接 时 是 “被 动 "的 。 最 后 ， 现 在 已 经 有 了 一 种 扩展 被 动 模式 
来 支持 第 6 版 本 的 网 际 协议 (IPv6 ) 地 








Python 已 经 支持 了 包括 FTP 在 内 的 大 多 数据 网 际 协议 。 支 持 各 个 协议 的 客户 端 模块 可 以 在 
jo /docs.python.orgWibyinternet.html 找 到 。 现 在 看 看 用 Python 创建 一 个 因特网 客户 端 程序 有 
多 简单 。 


17.2.3 Python 和 FTP 


， 我 们 怎么 用 Python 写 FTP 客 户 端 程序 呢 ? 其 实 ， 我 们 之 前 已 经 提 到 过 一 些 了 。 现 在 还 
Heic 的 Python 模块 导入 和 调用 的 操作 。 现 在 再 来 回顾 一 下 流程 : 


1.3 连接 到 服务 器 28 


3. 发 出 服务 请 求 (有 可 能 有 返回 信息 ) ; 
4. 退 出 。 


在 使 用 Python 的 FTP 支 持 时 ， 你 所 需要 做 的 就 是 导入 ftplib 模 块 ， 并 实例 化 一 个 ftplib.FTP 类 对 
象 ， 所 有 的 FTP 操 作 (如 登录 ， 传 输 文 件 和 登 出 等 ) 都 要 使 用 这 个 对 象 来 完成 。 下 面 是 一 段 
Python 的 伪 代 码 : 
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from ftplib import FTP 
f FTP('ftp.python.org') 


f.login('anonymous', 'guessQGwho.org') 


f.quit() 
EA ALES PIT Apo A414 63S — T ftplibFTP 3 0 Z7 » SORS ZEE NGS P8] 9 
17.2.4 ftplib.FTP 2: 7 ;X 


在 表 17.1 中 列 出 了 最 常用 的 方法 ， 这 个 表 并 不 全 面 
码 一 -但 这 里 列 出 的 方法 组 成 了 我 们 在 Python 中 FTP 客 户 端 编程 的 “AP|”。 








表 17.1 FTP 对 象 相关 方法 
方 法 m x 

login(uxer-' anonymous, Pd acc) | 登录 到 FTP 服务 器， 所 有 的 参数 帮 是 可 按 的 
pwit) 得 到 当前 工作 目录 
ewdipath) 把 当前 工作 目录 设置 为 path 
dinfipur 导 ceo 及 显示 path 目录 蛙 的 内 容 ， 可 选 的 参数 由 是 一 个 同调 霄 数 ， 它 会 被 传 给 retrlines() 方 法 
nist([path|,...]]) 与 dir0 类 做 ， 但 返回 一 个 文件 名 的 列表 ， 而 不 是 显示 这 此 文件 名 
retitines(cmd { cb]) pebi “RETR filename" ) ， 用 于 下 载 文本 文件 。 可 选 的 回 轴 函 数 cb 用 于 

cmd, cbf bar 81921, ra]]) ee AEE SAET uMft. FWAR cb 用 于 处 理 每 一 块 《 块 大 
storlines(cmd, f) 给 定 FTP 命令 《如 “STOR filename" 2 , UERTAT. Wit xig f 
storbinary(cmd, fi r-8192]) NN 只 是 这 个 指令 处 再 二 进 制 文件 ,要 俊 定 一 个 文件 对 象 人 上 传 块 大 小 
renametoíd, new) 把 运程 文件 old 改 各 为 new 
delete(path) BR OT. pah 的 远 姓 文 件 
mkdí(directory) 创建 运程 目录 
rmáídirectory) 删除 远程 目录 
quit() 关闭 连接 并 进出 


想 查 看 所 有 的 方法 ， 请 参阅 模块 源 代 


也 就 是 说 ， 你 不 一 定 要 使 用 其 他 的 方法 ， 因 为 它们 或 者 是 辅助 函数 ， 或 者 是 管理 函数 ， 或 者 


是 被 API 调 用 的 。 


在 一 般 的 FTP 通 讯 中 ， 要 使 用 到 的 指令 有 login()、cwd()、dir()、pwd()、stor*()、retr*() 和 


AT 
quit()。 有 一 些 没有 列 出 的 FTP 对 象 方法 也 是 很 有 用 的 。 请 参阅 Python 的 文档 以 得 到 更 多 关于 


FTP 对 象 的 信息 : 


http://python.org/docs/current/lib/ftp-objects.html 


17.25 交互 式 FTP 示 例 
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在 Python 中 使 用 FTP 非 常 的 简单 ， 你 甚至 可 以 不 用 写 脚 本 ， 直 接 在 交互 式 解 释 器 中 实时 地 看 
到 交互 与 输出 。 下 面 这 个 例子 是 在 几 年 前 ，python.org 还 支持 ftp 服 务 的 时 候 做 的 。 


>>> from ftplib import FTP 

>>> f = FTP('ftp.python.org') 

>>> f.login('anonymous', '-helppython.org') 

'230 Guest login ok, access restrictions apply.' 
>>> f.dir() 

total 38 

drwxrwxr-x 10 1075 4127 512 May 17 2000 
drwxrwxr-x 10 1075 4127 512 May 17 2000 
drwxr-xr-x 3 root wheel 512 May 19 1998 bin 
drwxr-sr-x 3 root 1400 512 Jun 9 1997 dev 


drwxr-xr-x 3 root wheel 512 May 19 1998 etc 
lrwxrwXxrwx l root bin 7 Jun 29 1999 lib ->usr/lib 
-r--r--r-- 1 guido 4127 52 Mar 24 2000 motd 
drwxrwsr-x 8 1122 4127 512 May 17 2000 pub 
drwxr-xr-x 5 root wheel 512 May 19 1998 usr 

>>> f.retrlines('RETR motd') 

Sun Microsystems Inc.SunOS 5.6 Generic August 1997 

'226 Transfer complete. 

>>> f.quit() 

'221 Goodbye.' 


17.2.0 ”客户 端 FTP 程 序 举例 


之 前 我 们 说 过 ， 你 可 以 不 写 脚本 ， 在 交互 环境 中 使 用 FTP。 不 过 ， 下 面 我 们 还 是 要 写 一 段 脚 
本 ， 假 设 你 要 从 Mozilla 的 网 站 下 载 最 新 的 Bugzilla 的 代码 。 例 17.1 就 是 用 来 完成 这 个 工作 的 。 
我 们 在 试 着 写 一 个 应 用 程序 ， 不 过 ， 你 也 可 以 交互 式 地 运行 这 段 代 码 。 我 们 的 程序 使 用 FTP 库 
来 下 载 文件 ， 也 做 了 一 些 错 误 检测 。 


不 过 ， 程 序 并 不 完全 自动 。 你 要 自己 决定 什么 时 候 要 去 下 载 。 如 果 你 在 使 用 类 Unix 系 统 ， 你 
可 以 设 定 一 个 "cron "任务 来 自动 下 载 。 另 一 个 问题 是 ， 如 果 文 件 的 文件 名 或 目录 名 改 了 的 话 ， 
程序 就 不 能 正常 工作 了 。 


这 个 程序 用 于 下 载 网 站 中 最 新 版 本 的 文件 。 你 可 以 修改 这 个 程序 让 它 下 载 你 喜欢 的 程序 。 
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$!/usr/bin/env python 


import ftplib 


import os 
import socket 


HOST = 'ftp.mozilla.org' 
DIRN = 'pub/mozilla.org/webtools' 


FILE = 'bugzilla-LATEST.tar.gz' 


def main(): 


try: 
f = ftplib.FTP(HOST) 

except (socket.error, socket.gaierror), e: 
print 'ERROR: cannot reach "$s"' $ HOST 
return 

print '*** Connected to host "$s"' $ HOST 


try: 
f.login() 
except ftplib.error perm: 
print 'ERROR: cannot login anonymously' 
f.quit() 
return 
print '*** Logged in as "anonymous"' 


try: 
f.cwd(DIRN) 
except ftplib.error perm: 
print 'ERROR: cannot CD to "$s"' $ DIRN 


f.quit() 
return 


print '*** Changed to "$s" folder' % DIRN 


f.retrbinary('RETR $s' $ FILE, 
open(FILE, 'wb').write) 


except ftplib.error perm: 


print 'ERROR: cannot read file "$s"' ¢ FILE 
os.unlink(FILE) 


else: 


print '*** Downloaded "$s" to CWD' & FILE 


f.quit () 
return 


if name  -- ' main ': 


main() 
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如 果 运 行 脚本 时 没有 出 错 ， 则 会 得 到 如 下 输出 : 


$ getLatestFTP.py 

*** Connected to host "ftp.mozilla.org" 

*** Logged in as "anonymous" 

*** Changed to "pub/mozilla.org/webtools" folder 


*** Downloaded "bugzilla-LATEST.tar.gz" to CWD 


代码 前 几 行 导入 要 用 的 模块 和 设置 一 些 常量 。 
11 ~ 44 行 
main() 有 函数 分 为 以 下 几 步 : 创建 一 个 FTP 对 象 ， 尝 试 连接 到 FTP 服 务 器 (121741) 然后 返 


回 。 在 有 任何 错误 发 生 的 时 候 退 出 。 我 们 尝试 用 "匿名 "登录 ， 如 果 不 行 就 结束 (19 一 25 行 ) 。 
下 一 步 就 是 转 到 发 布 目 录 〈27~33 行 ) ， 最 后 ， 下 载 文件 (35-4441) ° 


在 35~~36 行 ， 我 们 传 了 一 个 回调 函数 给 retrbinary()， 它 在 每 接收 到 一 块 二 进 制 数据 的 时 候 都 
会 被 调用 。 这 个 函数 就 是 我 们 创建 的 本 地 文件 对 应 文件 对 象 的 Write 方 法 。 在 传输 结 n 
候 ，Python 解 释 器 会 自动 关闭 这 个 文件 对 象 ， 而 不 会 丢失 数据 。 虽 然 这 样 方便 ， 但 最 好 还 

不 要 这 样 做 ， 作 为 一 个 程序 员 ， 要 尽量 做 到 在 资源 不 再 被 使 用 的 时 候 就 直接 释放 ， a 
赖 其 他 代码 来 做 释放 操作 。 在 这 里 ， 我 们 应 该 把 文件 对 象 保 存 到 一 个 变量 中 ， 如 变量 loc， 然 
后 把 loc.write 传 给 ftp.retrbinary() 方 法 。 


在 代码 中 ， 如 果 由 于 某 些 原因 我 们 无 法 保存 这 个 文件 ， 那 要 把 存在 的 空 文件 给 删 掉 ， 以 防 搞 
乱 文 件 系统 (4047) 。 最 后 ， 我 们 使 用 了 try-exceptrelse 语 名 〈35 一 42 行 ) ， 而 不 是 写 两 遍 关 
闭 FTP 和 连接 然后 返回 的 代码 。 


46 ~ 47 行 


这 是 运行 独立 脚本 的 惯用 方法 。 


17.2.7 FTP 的 其 他 方面 


Python 同 时 支持 主动 和 被 动 模式 。 注 意 ， 在 Python2.0 及 以 前 版 本 中 ， 被 动 模式 支持 默认 是 关 
闭 的 ， 在 Python2.1 及 以 后 版 本 中 ， 默 认 是 打开 的 。 


以 下 是 一 些 典型 的 FTP 客 户 端 类 型 : 


e 命令 行 客户 端 ih 你 可 以 使 用 一 些 FTP 文 件 传 输 工 具 如 /bin/ftp 或 NcFTP， 它 们 允许 用 
令 行 交互 式 的 参与 到 FTP 通 讯 中 来 


e GUI 客户 端 程序 : 与 命令 行 客 户 端 程序 相似 ， 只 是 它 是 一 个 GUI 程序 。 如 WsFTP 和 Fetch 
等 。 

e 网 页 浏览 器 : 在 使 用 HTTP 之 外 ， 大 多 数 网 页 浏览 器 (也 是 一 个 客户 端 ) 可 以 进行 FTP 通 
讯 。URL/URI 的 第 一 部 分 就 用 来 表示 所 使 用 ys ， 如 “http:Wblahblah." 这 就 告诉 浏览 器 
要 使 用 HTTP 作 为 与 给 定 网 站 进行 通讯 的 协议 。 修 改 协议 部 分 ， 就 可 以 发 使 用 FTP 的 请 
求 ， 如 "ftp:Wblahblah.”， 这 跟 使 用 HTTP 的 网 页 的 URL 很 像 (当然 ，'“ftp://" 后 面 
的 “blahblah” 可 以 展开 为 “host/path ? attributes”) 。 如 果 要 登录 ， 用 户 可 以 把 登录 信息 

(以 明文 方式 ) 放 在 URL 里 ， 如 : 


“ ftp://user:passwd@host/path?attrl=vall&attr2=val2... ” 


e 定制 程序 : 你 自己 写 的 用 于 FTP 文 件 传输 的 程序 。 由 于 程序 用 于 特殊 目的 ， 一 般 这 种 程序 
都 不 允许 用 户 与 服务 器 接触 。 


这 4 种 客户 端 类 型 都 可 以 用 Python 来 写 。 上 面 ， 我 们 用 ftplib 来 创建 了 一 个 自己 的 定制 程序 ， 你 
也 可 以 自己 做 一 个 命令 行 的 应 用 程序 。 在 命令 行 的 基础 上 ， 你 可 以 使 用 一 些 界面 工具 包 ， 如 
Tk、wxWidgets、GTK+、Qt、MFC， 其 至 Swing (要 导入 相应 的 Python[ 或 Jython] 的 接口 模 
块 ) 来 创建 一 个 完整 的 GUI 程序 。 最 后 ， 你 可 以 使 用 Python 的 urllib 模 块 来 解析 FTP 的 URL 并 进 
行 FTP 传 输 。 在 urllib 的 内 部 也 导入 并 使 用 了 ftplib,urllib 也 是 ftplib 的 客户 端 。 


FTP 不 仅 可 以 用 在 下 载 应 用 程序 上 ， 还 可 以 用 在 系统 之 问 文件 的 转移 上 。 比 如 ， 如 果 你 是 一 个 
工程 师 或 是 系统 管理 员 ， 你 需要 传输 文件 。 在 跨 网 络 的 时 候 ， 很 明显 可 以 使 用 scp 或 rsync 命 
令 ， 或 者 把 文件 放 到 一 个 外 部 能 访问 的 服务 器 上 。 不 过 ， 在 一 个 安全 网 络 的 内 部 机 器 之 间 移 
动 大 量 的 日 志 或 数据 库 文件 ， 这 种 方法 的 开销 就 太 大 了 ， 要 注意 安全 性 、 加 密 、 压 缩 、 解 压 
缩 等 。 如 果 你 想 要 做 的 只 是 写 一 个 FTP 程 序 来 帮助 你 在 下 班 后 自动 移动 文件 ， 那 用 Python 是 
一 个 非常 好 的 主意 。 


从 FTP 协 议定 义 /规范 (RFC959) 中 ， 你 可 以 得 到 更 多 关于 FTP 的 信息 : ftp://ftp.isi.edu/in- 
notes/rfc959.txt 以 及 网 页 http:/www.networksorcery.com/enp/protocolftp.htm。 其 他 相关 的 
RFC 有 2228、2389、2428、2577、2640 和 4217。 想 了 解 更 多 Python 对 FTP 的 支持 ， 可 以 访 
问 网 址 http://python.org/docs/current/lib/module-ftplib.html ° 


17.3 ”网络 新 闻 


17.3.1 Usenet 与 新 闻 组 


Usenet 新 闻 系 统 是 一 个 全 球 存 档 的 “电子 公告 板 ”。 各 种 主题 的 新 闻 组 一 应 俱全 ， 从 诗歌 到 政 
治 ， 从 自然 语言 学 到 计算 机 语言 ， 从 软件 到 硬件 ， 从 种 植 到 访 饪 以 及 招工 、 应 聘 、 音 乐 、 魔 
术 、 分 手 、 求 爱 等 。 新 闻 组 可 以 是 面向 全 球 泛 泛 而 谈 ， 也 可 以 是 只 面向 某 个 地 理 区 域 。 


整个 系统 是 一 个 由 大 量 计算 机 组 成 的 一 个 庞大 的 全 球 网 络 ， 计 算 机 之 间 共 享 Usenet 上 的 帖 
子 。 如 果菜 一 个 用 户 发 了 一 个 帖子 到 本 地 的 Usenet 计 算 机 上 ， 这 个 帖子 会 被 传播 到 其 他 相连 
的 计算 机 上 ， 并 再 由 这 些 计算 机 传 到 与 它们 相连 的 计算 机 上 ， 直 到 这 个 帖子 传播 到 了 全 世 
界 ， 每 个 人 都 收 到 这 个 帖子 为 止 。 


每 个 系统 都 有 一 个 它 已 经 "订阅 "的 新 闻 组 的 列表 ， 它 只 接收 它 感 兴 趣 的 新 闻 组 里 的 帖子 一 一 而 
不 是 服务 器 上 所 有 新 闻 组 的 帖子 。Usenet 新 闻 组 服务 内 容 取决 于 服务 提供 者 ， 很 多 都 是 可 供 
公众 访问 的 ， 也 有 一 些 只 允许 特定 的 用 户 使 用 ， 例 如 付费 用 户 、 特 定 大 学 的 学 生 等 。 如 果 
Usenet 系 统管 理 员 设置 了 的 话 ， 有 可 能 会 要 求 输入 用 户 名 和 密码 。 管 理 员 也 可 以 设置 是 否 只 
允许 上 传 或 只 允许 下 载 。 





17.3.2 网 络 新 闻 传 输 协议 (NNTP) 


供用 户 在 新 闻 组 中 下 载 或 发 表 帖 子 的 方法 叫 网 络 新 闻 传 输 协议 (NNTP) ° BrainKantor (加 
利 福 尼 亚 大 学 圣地 亚 哥 分 校 ) 和 Phil Lapsley (加 利 福 尼 亚 大 学 伯克利 分 校 ) 创建 并 记录 在 
RFC 977 中 ， 于 1986 年 2 月 公布 。 其 后 的 更 新 记录 在 RFC 2980， 于 2000 年 10 月 公布 。 

作为 客户 端 /服务 器 架构 的 另 一 个 例子 ，NNTP 与 FTP 的 操作 方式 很 像 ， 而 且 简 单 得 多 。FTP 需 
要 不 同 的 端口 来 做 登录 、 数 据 传输 和 控制 ， 而 NNTP 只 使 用 一 个 标准 端口 119 来 做 通讯 。 你 给 
服务 器 一 个 请 求 ， 它 做 相应 的 反馈 ， 见 图 17-2。 


Usenet on the Internet 


E r 


NNTP Lr NN. MA M = SA e 
clients 1 TP (Posi 一 i| L NN TP / I NNTP 
(newsreaders) | NUM A -一 | servers 





A | ] EE I | 
| TE (update) L 





A 17-2 因特网 上 的 NNTP 客 户 端 和 服务 器 。 客 户 端 主要 阅读 新 闻 ， 有 时 也 发 帖子 。 文 
章 会 在 服务 器 之 间 做 同步 


17.3.3 Python 和 NNTP 


由 于 之 前 已 经 有 了 Python 和 FTP 的 经 验 ， 你 也 许可 以 猪 到 ， 一 定 有 一 个 库 nntplib 和 一 个 类 
nntplib./NNTP， 你 要 实例 化 这 个 类 。 你 猜 对 了 。 和 FTP 一 样 ， 我 们 所 要 做 的 就 是 导入 那个 
Python 模块 ， 然 后 调用 相应 的 方法 。 我 们 先 大 致 看 一 下 这 个 协议 : 


1. 连 接 到 服务 器 ; 


2. 登 录 (如 果 需 要 的 话 ) 
3. 发 送 请 求 ; 
4. 退 出 。 


是 不 是 有 点 熟悉 ?是 的 ， 这 几乎 就 是 完全 复制 了 FTP 协 议 。 唯 一 的 不 同 就 是 根据 NNTP 服 务 器 
的 配置 不 一 样 ， 登 录 这 一 步 是 可 选 的 。 


下 面 是 一 段 Python 的 伪 代 码 : 
from nntplib import NNTP 


n = NNTP('your.nntp.server') 


r,c,f,l,g = n.group('comp.lang.python') 


n.quit() 


一 般 来 说 ， 在 你 登录 完成 后 ， 你 要 调用 group() 方 法 来 选择 一 个 感 兴趣 的 新 闻 组 。 方 法 返回 服 
务 器 的 返回 信息 、 文 章 的 数量 、 第 一 个 和 最 后 一 个 文章 的 ID 和 组 的 名 字 。 在 有 了 这 些 信 息 
后 ， 你 会 做 一 些 其 他 的 操作 ， 如 从 头 到 尾 看 文章 、 下 载 整 个 帖子 (文章 的 标题 和 内 容 ) 或 发 
表 一 篇 文章 等 。 


在 看 真实 的 例子 之 前 ， 我 们 要 先 介 绍 一 下 nntplib.NNTP 类 的 一 些 常用 的 方法 。 


17.3.4 nntplib.NNTP 3 7 7X 


跟前 一 节 列 出 ftplib.FTP 类 的 方法 时 一 样 ， 我 们 不 会 列 出 nntplib.NNTP 的 所 有 方法 ， 只 列 出 你 
创建 NNTP 客 户 端 程序 时 可 能 用 得 着 的 方法 。 


跟 上 一 节 的 FTP 对 象 表 一 样 ， 还 有 一 些 NNTP 对 象 的 方法 没有 提 及 。 为 了 避免 混乱 ， 我 们 只 列 
出 了 你 可 能 用 得 到 的 。 其 余 的 ， 我 们 再 次 建议 你 参考 Python 手 册 。 
17.8.5 ”交互 式 NNTP 举 例 


接 下 来 ， 是 一 个 如 何 使 用 Python 中 NNTP 库 的 交互 式 的 例子 。 它 看 上 去 跟 交 互 式 的 FTP 的 例子 
差不多 (出 于 保密 的 原因 ， 电 子 邮件 地 址 都 做 了 修改 ) 。 


在 调用 表 17.2 中 所 列 的 group() 方 法 连接 到 一 个 组 的 时 候 ， 你 会 得 到 一 个 5 元 组 。 
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表 17.2 NNTP 对 象 的 方法 
3 d A ig 

i: 8pm. iR PIT CÓ. (rsp et, fst Ist, group) : «MOIS EO ALEAN. 

groupiname) 第 一 个 和 最 后 一 个 文章 的 号 码 以 及 给 名 , 所 有 数据 者 是 字符 市 (返回 的 group 与 我 们 传 进 去 的 
name 应 该 是 相同 的 》 

xhdrihár, ortrg, [ofile]) BERRIN artrg〈“ 头 - 居 ” 的 格式 ) 内 文章 hdr 头 的 列表 ， 或 给 出 到 文件 ofle 中 
给 定 文章 的 刘 ， 讨 可 以 是 六 息 的 ID《〈 放 在 尖 括 号 髓 ) ， 或 一 个 文章 对 GAFR) . E 

body(idlofile]) [o] —^4 ffl Cresp, anum, mid, data) : 服务 器 的 返回 信息 、 文 章 叶 《是 一 个 字符 串 )、 消 息 的 
ID《 放 在 尖 括 导 典 ) 和 文章 所 有 行 的 列表 束 把 数据 输出 到 文件 ofile 中 

head(id) 与 body0 相 做 ， 只 是 返回 的 元 姐 中 型 个 行 的 列表 中 只 包含 了 文章 的 标题 

article(id) 也 中 body0 一 样 ， 只 是 返回 的 元 组 中 那个 行 的 列表 中 包含 了 文章 的 标题 和 内 容 


让 文章 的 “指针 ”指向 id (OE. 47:00 IDA Ex «mg . iv] — TW body 一 


a 样 的 元 组 《rsp, anum, mid) . (8 A KARR 

nexi() 用 法 和 stat0) 类 做 ， 把 文章 指针 移 到 下 一 篇 文章 ， 返 回 与 stat) 相似 的 元 组 
last) MEM saN ELARRE EC. KEH stai Het msc 
postiwfile) 上 传 ufile 文件 对 象 里 的 内 容 《使 用 ufilereadline())。 并 在 当前 新 闻 组 发 表 
quit() 关闭 连接 ， 然 后 进出 


>>> from nntplib import NNTP 
>>> n = NNTP('your.nntp.server') 
»»» rsp, ct, fst, lst, grp - n.group('comp.lang.python') 
»»» rsp, anum, mid, data = n.article('110457') 
»»» for eachLine in data: 
print eachLine 
From: "Alex Martelli" «alexQ...» 
Subject: Re: Rounding Question 
Date: Wed, 21 Feb 2001 17:05:36 +0100 
"Remco Gerlich" «remcoQ8...»5 wrote: 
> Jacob Kaplan-Moss «jacob8...» wrote in comp.lang.python: 
»» So I've got a number between 40 and 130 that I want to round up to 
»» the nearest 10. That is: 
>> 
>> 40 --» 40, 41 --» 50, ..., 49 --» 50, 50 --» 50, 51 --> 60 
»» Rounding like this is the same as adding 5 to the number and then 
» rounding down. Rounding down is substracting the remainder if you were 
> to divide by 10, for which we use the % operator in Python. 
This will work if you use *9 in each case rather than *5 (note that he 
doesn't really want rounding -- he wants 41 to 'round' to 50, for ex). 
Alex 
>>> n.quit() 


'205 closing connection - goodbye!' 
>>> 


` 


17.3.6 ”客户 端 程序 NNTP 举 全 
在 NNTP 客 户 端 例子 中 ， 我 们 来 点 更 复杂 的 。 在 之 前 的 FTP 客 户 端 例子 中 ， 我 们 是 下 载 最 新 的 


文件 ， 这 一 次 ， 我 们 要 下 载 Python 语 言 新 闻 组 com.lang.python 里 的 最 后 一 篇 文章 。 下 载 完成 
后 ， 我 们 会 显示 文章 的 前 20 行 ， 而 且 是 前 20 行 有 意义 的 内 容 。 有 意义 的 内 容 是 指 那些 不 是 被 
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引用 的 文本 (引用 以 >" 或 中 开头 ) ， 也 不 是 像 这样 的 文本 “In article <... 
>,SOAndSo@some.domain wrote : ” 


最 后 ， 我 们 要 智能 地 处 理 室 行 。 在 文章 中 出 现 了 一 行 室 行 ， 那 我 们 就 显示 一 行 室 行 ， 但 如 果 
有 多 行 连续 的 空 行 ， 那 只 显示 一 行 宰 行 。 只 有 有 数据 的 行 Xa on dod d 


42 re 人 二 


能 显示 39 行 输出 ，20 行 实际 数据 间隔 了 19 行 空 行 。 


如 果 脚 本 的 运行 正常 的 话 ， 我 们 可 能 会 看 到 这 样 的 输出 : 


zeti TE y 
Connected to hos ur.nntp rver" 
Four Y'ewsgrour r ang. py ! 
Four 1st rti (44 6) 
F " Gerard agan grg agant. 
Subject: Re: Generate a sequence of random imber tha m tc 
Date: Sat Apr 22 10:48:2 EST 2006 
F ( meaning! ine 
1 pa UN 
ils 1( random.r iom ( ange (2*! ) 
rals v * 
I | range ( 1) 
Í vals H, 
jeltas -x[0] x i part (0 
print i 
print sum(de 15) 
102719566€ ' 357649 4 - € 69135 1 g 
119064524544673 5 1984 c 11732423830768 
l 3 3129564 312, 0 5 165520102249, 0 83513058781761 
) € 76205365, 0.099139 810€ 6726 


这 个 脚本 下 载 并 显示 Python 新 闻 组 comp.lang.python 最 后 一 篇 文章 的 前 20 个 “有 意义 的 " 行 
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1  £$!/usr/bin/env python 
2 

3 import nntplib 

4 import socket 

5 

6  HOST- 'your.nntp.server 
7 | GRNM- 'comp.lang.python 
8 USER= 'wesley ' 

9  PASS- "you'llNeverGuess" 
10 

11 def main(): 

12 
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13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 


try: 
n * nntplib.NNTP(HOST) 
f, user-USER, passwordePASS, 
except socket.gaierror, e: 
print 'ERROR: cannot reach host "às"* * HOST 
print ' ("*s")' $ eval(str(e)) [1] 
return 
except nntplib.NNTPPermanentError, e: 
print 'ERROR: access denied on "$s"' & HOST 
print ' ("55")' * strie) 
return 
print '*** Connected to host "&is"' 4 HOST 


try: 
rsp, ct, fst, lst, grp = n.group(GRNM) 
except nntplib.NNTPTemporaryError, e: 
print 'ERROR: cannot load group "*s"' è GRNM 
print '  ("*s")' à str(e) 
print ' Server may require authentication" 
print ' Uncomment/edit login line above" 
n.quit() 
return 
except nntplib.NNTPTerporaryÉrror, e: 
print 'ERROR: group "is" unavaílable' & GRNM 
print ' ("*is5")' à str(e) 
n.quit () 
return 
print '*** Found newsgroup "*s"' ù GRNM 


rng = '*s-*s' * (lst, 1st) 

rsp, frm = n.xhdr('from', rng) 

rsp, sub = n.xhdrí('subject', rng) 

rsp, dat = n.xhdr('date', rng) 

print '''*** Found last article (Fts): 


From: ®3 
Subject: ts 
Date: $s 


51 *'** (1st, frm[0][1], sub[0][1), dat[0] [1]) 


52 
53 
54 
55 
56 


rsp, anum, mid, data * n.body(lst) 
displayFirst20 (data) 
n«quit() 


57 def displayFirst20 (data) : 


58 
58 
60 
61 


print '*** First (<= 20) meaningful lines:Wn' 
count = 0 

lines = (line.rstrip() for line ín data) 
lastBlank = True 
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62 for line in lines: 

63 if line: 

64 lower = line.lower() 

65 if (lower.startswith('»') and not \ 
66 lower.startswith('»»»')) or ^ 
67 lower.startswith('|') or ^ 

68 lower.startswith('in article') or \ 
69 lower.endswith('writes: ') or \ 
70 lower.endswith ('wrote: '): 

71 continue 

72 if not lastBlank or (lastBlank and line): 
73 print ' %s' $ line 

74 if line: 

75 count += 1 

76 lastBlank = False 

77 else: 

78 lastBlank = True 

79 if count == 20: 

80 break 

81 

82 if _name__ == '_main_': 

83 main () 


这 个 输出 显示 了 新 闻 组 帖子 的 原始 内 容 ， 如 下 : 
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From: "Gerard Flanagan" «grflanaganG...» 

Subject: Re: Generate a sequence of random numbers that sum up to 1? 
Date: Sat Apr 22 10:48:20 CEST 2006 

Groups: comp.lang.python 

Gerard Flanagan wrote: 


» Anthony Liu wrote: 

> > I am at my wit's end. 

> > I want to generate a certain number of random numbers. 

> > This is easy, I can repeatedly do uniform(0, 1) for 

> > example. 

> > But, I want the random numbers just generated sum up 
2wto1l 

> > I am not sure how to do this. Any idea? Thanks. 

o Se ————————————" 
» import random 

> def partition(start-0,stop-1l,eps-5): 

> d= stop - start 

> vals = [ start + d * random.random() for _ in range(2*eps) ] 
» vals = [start] + vals + [stop] 

» vals.sort() 

» return vals 

> P = partition() 

> intervals = [ P[i:i*2] for i in range(len(P)-1) ] 

> deltas = [ x[1] - x[0] for x in intervals ] 

» print deltas 


» print sum(deltas) 


def partition(N»5): 

vals = sorted( random.random() for 

vals = [0] * vals + [1] 

for j in range(2*N*1): 

yield vals[j:1*2] 

deltas = [ x(1]-x[0] for x in partition() ] 
print deltas 
print sum(deltas) 
[0.10271966686994982, 0.13826576491042208, 0.064146913555132801, 
0.11906452454467387, 0.10501198456091299, 0.011732423830768779, 
0.11785369256442912, 0.065927165520102249, 0.098351305878176198, 
0.077786747076205365, 0.099139810689226726] 
1.0 


in range(2*N) ) 


当然 ， 由 于 新 文章 不 断 出 现 ， 输 出 经 常会 不 一 样 。 只 要 你 的 服务 器 里 一 有 文章 更 新 ， 输 出 就 


会 不 一 样 了 。 
逐 行 解释 
1~9 行 


程序 开始 是 一 些 导入 语句 和 常量 定义 ， 跟 FTP 容 户 端 差不多 。 
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11 ~ 4047 


在 第 一 部 分 ， 我 们 尝试 连接 到 NNTP 服 务 器 ， 如 果 失 败 就 退出 (13 一 24 行 ) 。 第 15 行 故意 注 
We CA etd M tea UU CNN dU RAN d 
是 尝试 读 取 指定 的 新 闻 组 。 同 样 ， 如 果 新 闻 组 不 存在 ， 服 务 器 没有 保存 这 个 新 闻 组 ， 或 是 
要 认证 的 话 ， 退 出 (26 一 40 行 ) 。 


42 ~ 55 行 


下 面 这 一 部 分 ， 我 们 读 一 些 头 信息 ， 并 显示 出 来 (425147) 。 最 有 用 处 的 头 信息 包括 作 
者 、 Sd 。 这 些 数 据 会 被 读 取 并 显示 给 用 户 。 在 每 一 次 调用 xhdr() 方 法 时 ， 都 要 给 定 想 
要 提取 信息 头 的 文章 的 范围 。 我 们 只 想 取 一 条 信息 ， 所 以 范围 就 是 “X-X"， 其 中 ，X 是 最 后 一 
a dk 


Xxhdr() 方 法 返回 一 个 2 元 组 ， 包 含 了 服务 器 的 返回 信息 (rsp) 和 我 们 指定 范围 的 信息 头 的 列 
表 。 bebo RADAR S & (最 后 一 个 ) ， 我 们 只 取 列 表 的 第 (hdr[O]) 。 数 据 
元 素 是 一 个 2 元 组 ， 包 含 文章 号 和 数据 字符 串 。 由 于 我 们 已 经 知道 章 号 (我 们 在 请 求 中 给 
a 


最 后 一 部 分 


分 是 下 载 文章 的 内 容 (53-56). 。 先 调用 body() 方 法 ， 然 后 显示 前 20 个 有 意义 的 
， 最 后 登 出 


服务 器 és ? 完成 执行 P 
57 ~ 80 行 


主要 的 处 理 任务 由 displayFirst200 函 数 完成 《57~80 行 ) 。 它 接受 文章 的 所 有 行 作为 参数 ， 并 
做 一 些 预 处 理 ， 如 把 计数 器 清 0， 创 建 一 个 生成 器 表达 式 对 文章 内 容 的 所 有 行 做 一 些 处 理 ， 然 
后 “假装 ?我 们 刚 碰 到 并 显示 了 一 行 空 行 (59 一 61 行 ， 稍 后 细 说 ) 。 由 于 前 导 空 格 可 能 是 
Python 代码 的 一 部 分 ， 所 以 在 我 们 去 掉 字 符 串 中 的 空格 的 时 候 ， 只 删除 字符 串 右 边 的 空格 
(rstrip()) ° 


我 们 要 做 的 是 ， 我 们 不 要 显示 引用 的 文本 和 引用 文本 指示 行 。 这 就 是 65~71 行 (也 包 
行 ) 的 那个 大 if 语 名 所 要 做 的 事 。 如 果 这 一 行 不 是 空 行 的 时 候 ， 才 做 这 个 检查 eral 。 检 查 
的 时 候 ， 会 把 字符 串 转 成 小 写 ， 这 样 就 能 做 到 比较 的 时 候 大 小 写 无 关 〈64 行 ) 。 


如 果 一 行 以 “>" 或 中 开头 ， 说 明 这 一 般 是 一 个 引用 。 不 过 ， 我 们 认为 “>>>” 是 一 个 例外 ， 因 为 这 
有 可 能 是 交互 命令 行 的 提示 ， 虽 然 这 样 可 能 有 问题 ， 因 为 它 也 可 能 是 一 段 被 引用 了 三 次 的 消 
息 (1 段 文本 到 第 4 个 回复 的 帖子 时 被 引用 了 3 次 ) 却 被 显示 了 。 


做 到 智能 。 如 果 有 多 个 连续 的 空 行 ， 则 只 显示 第 一 个 ， 这 样 用 户 不 用 看 那么 多 行 信 导致 
有 用 的 信息 却 在 屏幕 之 外 。 我 们 也 不 能 把 空 行 计 算 行 有 意义 的 行 之 中 。 ponis 要 求 都 
在 72~~78 行 内 实现 。 


现在 来 处 理 空 行 。 我 们 想 让 程序 聪明 一 些 ， 它 应 该 能 显示 文章 中 的 空 CUN 于 的 处 理 要 
一 个 a 
些 要 


72 行 的 if 语 句 表示 只 有 在 上 一 行 不 为 空 ， 或 者 上 一 行为 空 但 当前 行 不 为 空 的 时 候 才 显 示 。 也 就 
是 说 ， 如 果 显 示 了 当前 行 的 话 ， 就 说 明 要 么 当前 行 不 为 室 ， 要 么 当前 行为 空 但 上 一 行 不 为 
空 。 这 是 另 一 个 比较 有 技巧 的 地 方 : 如 果 我 们 碰 到 了 一 个 非 空 行 ， 计 数 器 加 1， 并 设置 
lastBlank 标 志 为 False， 以 表示 这 一 行 非 空 (74~76 行 ) 。 和 否则 ， 表 示 我 们 碰 到 了 空 行 ， 把 标 
SA True 。 


现在 回 到 第 61 行 ， 我 们 设 lastBlank 标 志 为 True， 是 因为 ， 如 果 内 容 的 第 一 行 实际 数 据 (不 是 
前 导数 据 或 是 引用 数据 ) 是 一 个 空 行 ， 我 们 不 会 显示 它 。 因 为 我 们 想 要 看 第 一 行 实际 数据 ! 


最 后 ， 如 果 我 们 已 经 显示 了 20 行 非 空 行 ， 则 退出 ， 放 弃 其 余 的 行 (79~80 行 ) ° GM > RN 
应 该 已 经 遍历 了 所 有 行 ， 循 环 也 正常 结束 了 。 


17.8.7 NNTP 的 其 他 方面 


从 NNTP 协 议定 义 / 规 范 (RFC 977) 中 ， 你 可 以 得 到 更 多 关于 NNTP 的 信息 : ftp://ftp.isi. 
edu/in-notes/rfc977.txt 以 及 网 页 http://www.networksorcery.com/enp/protocol/nntp.htm。 其 他 
相关 的 RFC 有 1036、2980。 想 了 解 更 多 Python 对 NNTP 的 支持 ， 可 以 从 这 里 开始 : 
http://python.org/docs/current/lib/module-nntplib.html 


17.4 ”电子 邮件 


电子 邮件 既 古 老 又 现代 。 对 于 我 们 这 些 从 很 旱 就 开始 用 因特网 的 人 来 说 ， 电 子 邮 件 看 上 去 是 
如 此 的 “古老 "， 尤 其 是 相对 于 基于 网 页 的 在 线 聊 天 ， 即 时 通讯 (IM) 和 数字 电话 即 VOIP 
(Voice Over Internet Protocol) 等 更 新 更 快 的 通讯 方式 来 说 更 是 如 此 。 下 一 节 中 ， 我 们 将 从 
宏观 上 介绍 一 下 电子 邮件 是 如 何 工作 的 。 如 果 你 已 经 对 此 相当 了 解 ， 只 想 看 如 何 用 Python 做 
电子 邮件 相关 的 开发 ， 你 可 以 跳 到 后 续 章节 。 


在 看 电子 邮件 的 底层 的 结构 之 前 ， 你 有 没有 问 过 自己 ， 电 子 邮 件 的 确切 定义 到 底 是 什么 ?了 根 
据 RFC2822 ，“ 消 息 由 头 域 ( 合 起 来 叫 消 息 头 ) 以 及 后 面 可 选 的 消息 体 组 成 "*。 对 于 一 般 用 户 
来 说 ， 一 说 起 电子 邮件 就 会 让 我 们 想到 它 的 内 容 ， 不 管 它 是 一 封 监 的 邮件 还 是 一 封 不 请 自 来 
的 商业 广告 ( 即 Sspam， 垃 圾 邮件 ) ， 都 应 该 有 内 容 。 不 过 ，RFC 规 定 ， 邮 件 体 是 可 选 的 ， 只 
有 邮件 头 是 必要 的 。 这 一 点 要 特别 注意 。 


17.4.1 电子 邮件 系统 组 件 和 协议 


不 管 你 是 怎么 样 想 的 ， 电 子 邮 件 实际 上 在 现代 的 因特网 出 现 之 前 就 已 经 出 现 了 。 它 一 开始 用 
于 大 型 机 的 用 户 之 间 简 单 的 交换 信息 。 注 意 ， 由 于 他 们 都 在 使 用 同一 台电 脑 ， 所 以 ， 这 里 其 
至 都 没有 涉及 到 网 络 。 后 来 ， 当 网 络 成 为 现实 的 时 候 ， 用 户 就 可 以 在 不 同 的 主机 之 间 交 换 信 
息 。 当 然 ， 由 于 用 户 使 用 着 不 同 的 电脑 ， 电 脑 之 间 使 用 着 不 同 的 协议 ， 信 息 交换 成 了 一 个 很 
复杂 的 概念 。 直 到 20 世 纪 80 年 代 ， 因 特 网 上 用 电子 邮件 进行 信息 交换 才 有 了 一 个 事实 上 的 统 
一 的 标准 。 


在 深入 细节 之 前 ， 我 们 先 问 问 自己 ， 电 子 邮 件 是 怎么 工作 的 ?一 条 消息 是 如 何 从 发 件 人 那 通 
过 浩瀚 的 因特网 ， 到 达 收 件 人 的 ? 简单 点 来 说 ， 有 一 台 发 送 电脑 (发 件 人 的 消息 从 这 里 发 送 
出 去 ) ， 和 一 人 台 目 的 电脑 ( 收 件 人 的 信件 服务 器 ) 。 最 好 的 解决 方案 是 发 送 电脑 知 道 如 何 连 
接 到 接收 电脑 ， 这 样 一 来 ， 它 就 可 以 直接 把 消息 发 送 过 去 。 不 过 ， 实 际 上 一 般 并 不 这 么 顺 
利 。 


发 送 电 脑 要 查询 到 某 一 台中 间 主 机 ， 这 台中 间 主 机 能 到 达 最 后 的 收 件 主机 。 然 后 这 人 台中 间 主 
机 要 找 一 台 离 目的 主机 更 近 一 些 的 主机 。 所 以 ， 在 发 送 主机 和 目的 主机 之 间 ， 可 能 会 有 多 人 台 
叫做 “跳板 "的 主机 。 如 果 你 仔细 看 看 你 收 到 的 电子 邮件 的 邮件 头 ， 你 会 看 到 一 个 "passport" 标 
记 ， 其 中 记录 了 邮件 寄 给 你 这 一 路 上 都 到 过 了 哪些 地 方 。 


为 了 让 描述 清楚 一 些 ， 让 我 们 先 看 看 电子 邮件 系统 的 各 个 组 件 。 最 主要 的 组 件 是 消息 传输 代 
3€ (messagetransport agent, MTA) 。 这 是 一 个 在 邮件 交换 主机 上 运行 的 一 个 服务 器 程序 ， 
它 负 责 邮 件 的 路 由 、 队 列 和 发 送 工作 。 它 们 就 是 邮件 从 源 主机 到 目的 主机 所 要 经 过 的 跳板 。 
所 以 也 被 称 为 是 "信息 传输 ”的 “代理 ”。 


要 让 所 有 这 些 工作 起 来 ，MTA 要 知道 两 件 事情 : 1) 如 何 找到 消息 应 该 去 的 下 一 台 MTA;2) 如 
何 与 另 一 台 MTA 通 讯 。 第 一 件 事由 域名 服务 (domain name service, DNS) 来 查找 目的 域名 的 
MX (邮件 交换 ，Mail eXchange) 来 完成 。 这 对 于 最 后 的 收 件 人 是 不 必要 的 ， 但 对 其 他 的 跳 
板 来 说 ， 则 是 必要 的 。 对 于 第 二 件 事 ，MTA 怎 么 把 消息 转 给 其 他 的 MTA 呢 ? 


17.4.2 发 送 电 子 邮 件 


要 能 发 送 电 子 邮件 ， 你 的 邮件 客户 端 一 定 要 连接 到 一 个 MTA， 它 们 靠 某 种 协议 进行 通讯 。 
MTA 之 问 通讯 所 使 用 的 协议 叫 消息 传输 系统 (MTS) 。 只 有 两 个 MTA 都 使 用 这 个 协议 时 才能 
进行 通讯 。 在 本 节 开 始 时 就 说 过 ， 由 于 以 前 存在 很 多 不 同 的 计算 机 系统 ， 每 个 系统 都 使 用 不 
同 的 网 络 软 件 ， 这 种 通讯 很 危险 ， 有 具有 不 可 预知 性 。 更 复杂 的 是 ， 有 的 电脑 使 用 互 连 的 网 
络 ， 而 有 的 电脑 使 用 调制 解 调 器 拨号 ， 消 息 ie C UR 事实 上 ， 笔 者 曾经 
有 一 封 邮 件 在 发 送 9 个 月 后 才 收 到 ! 互连网 的 速度 怎么 么 慢 ? 出 于 对 这 些 复杂 度 的 考虑 ， 
现代 电子 邮件 的 基础 之 一 ， 简 单 邮件 传输 协议 cud Mail Transfer Protocol > SMTP) 于 
1982 年 出 现 了 。 


SMTP 


SMTP 由 已 故 的 乔纳森 * 波 斯 特 (Jonathan Postel， 加 利 福 尼 亚 大 学 信息 学 院 ) 创建 ， 记 录 在 
RFC 821 中 ， 于 1982 年 8 月 公布 。 其 后 的 修改 记录 在 RFC 2821 中 ， 于 2001 年 4 月 公布 。 一 些 
已 经 实现 了 SMTP 的 著名 MTA 包 括 : 


开 产 MTA 
e Sendmail 
e Postfix 


e Exim 


。 qmail (免费 发 布 ， 但 不 开源 ) 
商业 MTA 

e Microsoft Exchange 

e Lotus Notes Domino Mail Server 


注意 ， 虽 然 它 们 都 实现 了 RFC 2821 中 定义 的 最 小 化 SMTP 协 议 ， 它 们 中 的 大 多 数 ， 尤 其 是 一 
些 商 业 MTA， 都 在 服务 器 中 加 入 了 协议 定义 之 外 的 特有 的 功能 。 


SMTP 是 在 因特网 上 MTA 之 间 用 于 消息 交换 的 最 常用 的 MTS。 它 被 MTA 用 来 把 电子 邮件 从 一 
台 主 机 传送 到 另 一 台 主 机 。 在 你 发 电子 邮件 的 时 候 ， 你 必须 要 连接 到 一 个 外 部 的 SMTP 服 务 
器 ， 这 时 ， 你 的 邮件 程序 是 一 个 SMTP 客 户 端 。 你 的 SMTP 服 务 器 也 因此 成 为 了 你 的 消息 的 第 
一 个 跳板 。 


17.4.3 Pythonf- SMTP 


是 的 ， 也 存在 一 个 smtplib 模 块 和 一 个 smtplib.SMTP 类 要 实例 化 。 再 来 看 看 这 个 已 经 熟悉 的 过 
程 吧 : 


1. 连 接 到 服务 器 ; 

2. 登 录 (如 果 需 要 的 话 ) 
3. 发 出 服务 请 求 ; 

4. 退 出 。 


CR sd abo 器 打开 了 SMTP 认 证 (SMTP-AUTH) 时 才 要 登 
录 。SMTP-AUTH 在 RFC 2554 中 定义 。 还 是 跟 NNTP 一 样 ，SMTP 通 讯 时 ， 只 要 一 个 端口 
25。 


下 面 是 一 些 Python 的 伪 代 码 : 


from smtplib import SMTP 


n = SMTP('smtp.yourdomain.com') 


n.quit () 
在 看 监 实 的 例子 之 前 ， 我 们 要 先 介 绍 一 下 smtplib.SMTP 类 的 一 些 常 用 的 方法 。 


17.4.4 smtplib.SMTP 类 方法 





Python JZ 4 


跟 之 前 一 样 ， 我 们 会 列 出 smtplib.SMTP 类 的 方法 ， 但 不 会 列 出 所 有 的 方法 ， 只 列 出 你 创建 
SMTP 客 户 端 程序 所 需要 的 方法 。 对 大 多 数 电 子 邮 件 发 送 程序 来 说 ， 只 有 两 个 方法 是 必须 的 ， 
即 sendmail() 和 quit() 。 


sendmail() 的 所 有 参数 都 要 遵循 RFC 2822， 即 电子 邮件 地 址 必须 要 有 正确 的 格式 ， 消 息 体 要 
有 正确 的 前 导 头 ， 前 导 头 后 面 是 两 个 回 车 和 换行 (nn) 对 。 


注意 ， 实 际 的 消息 体 不 是 必要 的 。 根 据 RFC 2822, “唯一 要 求 的 头 信息 只 有 发 送 日 期 和 发 送 地 
址 ”*”， 即 “Date:” 和 “From:”: (MAIL FROM, RCPT TO,DATA) ° 

还 有 一 些 方法 没有 被 提 到 ， 不 过 ， 一 般 来 说 ， 它 们 不 是 发 送 电 子 邮 件 所 必须 的 。 请 参考 
Python 文档 以 获取 SMTP 对 象 的 所 有 方法 的 信息 。 


A 17.3 SMTP 对 象 相关 方法 













5 法 D SEE: 


把 msg 从 from 发 送 给 to (PURRE) . ESMTP UR (mops) 和 收 件 人 设置 
(ropts). 为 可 选 

关闭 连接 ， 然 后 退出 
使 用 user 用 户 和 passwd 密码 登录 到 SMTP 服务 器 只 在 有 SMTP-AUTH 时 使 用 








sendmail (from, to, mrg| mopts, ropts]) 









quit() 
login( user, pastwd)" 
a. SMTP-AUTH only. 





17.45 Z X ASMTP; f 


同样 地 ， 我 们 先 给 一 个 交互 式 的 例子 : 


>>> from smtplib import SMTP as smtp 

>>> 3 = smtpí('smtp.python.is.cool') 

»»» s.set debuglevel(1) 

>>> s.sendmail('wesley8python.is.cool', 
('wesleyüépython.is.cool','chunépython.is.cool'),'*' From: wesley8python.is.coolMrMTo: 
wesley(python.is.cool, chun8python.is.coolMXrMnSubject: test 
msgNrz Mn NrEMOxxxNr MO, 1! *) 

send: "'ehlo myMac.1local\r\n' 

reply: '250-python.ís.coolMrMn' 

reply: '250-7BIT'r'An' 

reply: '250-8BITMIMENrAn' 

reply: '250-AUTH CRAM-MDS LOGIN PLAIN\r\n' 

reply: '250-DSN\r\n' 

reply: '250-EXPNMrMn' 

reply: '250-HELPWrAn' 

reply: '250-NOOP^r^n' 

reply: '250-PIPELININGWMr*An' 

reply: '250-SIZE 15728640\r\n' 

reply: '250-STARTTLS'r'An" 
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reply: '250-VERS V05.00c++\r\n' 

reply: '250 XMVP 2NrMn' 

reply: retcode (250); Msg: python.is.cool 

7BIT 

8BITMIME 

AUTH CRAM-MD5 LOGIN PLAIN 

DSN 

EXPN 

HELP 

NOOP 

PIPELINING 

SIZE 15728640 

STARTTLS 

VERS V05.00c** 

XMVP 2 

send: 'mail FROM:«wesley8python.is.cool» size=108\r\n' 
reply: '250 ok\r\n' 

reply: retcode (250); Msg: ok 

send: 'rcpt TO:«wesley8python.is.cool»MrWMn' 
reply: '250 ok\r\n' 

reply: retcode (250); Msg: ok 

send: 'data\r\n' 

reply: '354 ok\r\n' 

reply: retcode (354); Msg: ok 

data: (354, 'ok') 

send: 'From: wesley&python.is.coolNMrMnTo: 
wesley8python.is.coolMXrMnSubject: test 
msg\r\n\r\nxxx\r\n..\r\n.\r\n' 

reply: '250 ok ; id=20051226235837013000or7hħe\r\n' 
reply: retcode (250); Msg: ok ; id-20051226235837013000r7hhe 
data: (250, 'ok ; id-20051226235837013000r7hhe') 
i} 

>>> s.quit() 

send: 'quit\r\n' 

reply: '221 python.is.cool\r\n’ 

reply: retcode (221); Msg: python.is.coocl 


17.4.6 SMTP 的 其 他 方面 


从 SMTP 协 议定 义 /规范 (RFC 2821) 中 ， 你 可 以 得 到 更 多 关于 SMTP 的 信息 : 
ftp://ftp.isi.edu/in-notes/rfc2821.txt 以 及 网 页 
http://www.networksorcery.com/enp/protocol/smtp.htm 。 想 了 解 更 多 Python 对 SMTP 的 支持 ， 
可 以 从 这 里 开始 : http://python.org/docs/current/lib/module-smtplib.html ° 


我 们 还 没有 讨论 的 电子 邮件 的 一 个 很 重要 的 方面 是 如 何 正 确 地 设 定 因 特 网 地 址 的 格式 和 电子 
邮件 消息 。 这 些 信息 详细 记录 在 因特网 信息 格式 RFC 2822 中 ， 可 以 在 ftp://ftp.isi.edu/in- 
notes/rfc2822. txt 下 载 。 
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17.4.7. 接收 电子 邮件 


在 以 前 ， 在 因特网 上 用 电子 邮件 通讯 的 只 有 大 学 学 生 、 研 究 人 员 和 工商 企业 的 雇员 。 桌 面 电 
脑 还 都 是 类 Unix 操 作 系 统 。 家 庭 用 户 只 是 拨号 到 PC 上 ， 并 不 真 的 使 用 电子 邮件 。 在 20 世 纪 90 
年 代 中 期 因特网 大 爆炸 的 时 候 ， 电 子 邮件 进入 了 千家 万 户 。 


对 于 家 族 用 户 来 说 ， 在 家 里 放 一 个 工作 站 来 运行 SMTP 是 不 现实 的 。 必 须要 设计 一 种 新 的 系 
统 ， 能 够 周期 性 地 把 信件 下 载 到 本 地 计算 机 ， 以 供 离 线 时 使 用 。 这 样 的 系统 就 要 有 一 套 新 的 
协议 和 新 的 应 用 程序 来 与 邮件 服务 器 通讯 。 


在 家 用 电脑 中 运行 的 应 用 程序 叫 邮件 用 户 代理 (mail user agent, MUA) 。MUA 从 服务 器 上 下 
载 邮件 ， 在 这 个 过 程 中 可 能 会 自动 删除 它们 (也 可 能 不 删除 ， 留 在 服务 器 上 ， 让 用 户 手动 删 

ME) 。 不 过 ，MUA 也 必须 要 能 发 送 邮 件 。 也 就 是 说 ， 在 发 送 邮 件 的 时 候 ， 它 要 能 直接 与 MTA 
用 SMTP 进 行 通讯 。 在 前 面 讲 SMTP 的 章节 中 ， 我 们 已 经 看 过 这 种 客户 端 了 。 那 下 载 邮件 的 

呢 ? 


17.4.8 POP 和 IMAP 


用 于 下 载 邮件 的 第 一 个 协议 叫 邮 局 协议 ， 记 录 在 RFC 918 中 ， 于 1984 年 10 月 公布 。" 邮 局 协议 
(POP) 的 目的 是 让 用 户 的 工作 站 可 以 访问 邮箱 服务 器 里 的 邮件 。 邮 件 要 能 从 工作 站 通过 简 
单 邮 件 传输 协议 (SMTP) 发 送 到 邮件 服务 器 "。POP 协 议 的 最 新 版 本 是 第 3 版 ， 也 叫 POP3 。 
POP3 在 RFC 1939 中 定义 ， 至 今 为 止 仍 在 被 广泛 地 使 用 ， 也 是 我 们 下 面 的 客户 端 例子 的 主要 
内 容 。 


在 POP 之 后 几 年 ， 出 现 了 另 一 个 协议 ， 叫 交互 式 邮 件 访问 协议 (Interactive Mail Access 
Protocol: IMAP) 。 第 一 个 版 本 是 实验 性 的 ， 直 到 第 2 版 时 ， 其 RFC 1064 才 在 1988 年 被 公 
布 。 现 在 被 使 用 的 IMAP 版 本 是 IMAP4revl， 它 也 被 广泛 地 使 用 。 事 实 上 ， 当 今世 界 上 占有 邮 
件 服务 器 大 多 数 市 场 的 Microsoft Exchange 就 使 用 IMAP 作 为 其 下 载 机 制 。IMAP4revl 协 议定 义 
在 RFC 3501， 于 2003 年 3 月 公布 。IMAP 的 目的 是 要 提供 一 个 更 全 面 的 解决 方案 。 不 过 ， 它 比 
POP 更 为 复杂 。 对 IMAP 的 进一步 讨论 超出 了 本 章 剩余 部 分 的 范围 。 我 们 建议 感 兴趣 的 用 户 参 
考 上 述 RFC 文 档 。 图 17-3 展 示 的 复杂 系统 就 是 我 们 所 认为 的 简单 的 电子 邮件 。 


Internet 








POP3IMAP4 
(receive) 
Mail | SPAM & virus | 
chen = Wong Maf | Mai 
"V dovi server | client 
Sender | j | zi H vul ud vm Recipient 
(or recipient) | (or sender) 





M. ree o MERI 


pubs 和 
| SMTP (send) 





17-3 ”因特网 上 的 电子 邮件 发 件 人 和 收 件 人 。 客 户 端 通过 他 们 的 MUA 和 相应 的 MTA 进 
行 通讯 ， 来 下 载 和 发 送 邮 件 。 电 子 邮 件 从 一 个 MTA “ 跳 " 到 另 一 个 MTA， 直 到 到 达 目 的 地 
为 止 

17.4.9 Python 和 POP3 


不 奇怪 ， 我 们 要 做 的 是 导入 poplib， 实 例 化 poplib.POP3 类 。 标 准 的 做 法 如 下 : 


e 


1. 连 接 到 服务 器 ; 


3. 发 出 服务 请 求 ; 
4. 退 出 。 


Python 的 伪 代 码 如 下 : 


from poplib import POP3 

p = POP3('pop.python.is.cool') 

SU (rou) 

Ha pass Ma 

p.quit () 
在 看 监 实 的 例子 之 前 ， 我 们 要 先 看 一 个 交互 式 的 例子 以 及 介绍 一 下 poplib.POP3 类 的 一 些 基 
的 方法 。 
17.4.00 ”交互 式 POP3 举 例 


下 面 是 使 用 Python poplib 模 块 的 交互 式 的 例子 : 
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>>> from poplib import POP3 
>>> p = POP3('pop.python.is.cool') 
>>> p.user('techNstuff4U') 
' OK" 
»»» p.pass ('notMyPasswd') 
Traceback (most recent call last): 
File "«stdin»", line 1, in ? 
File "/usr/local/lib/python2.4/poplib.py", line 202, 
in pass, 
return self. shortcmd('PASS $s' $ pswd) 
File "/usr/local/lib/python2.4/poplib.py", line 165, 
in shortcmd 
return self. getresp(í) 
File "/usr/local/lib/python2.4/poplib.py", line 141, 
in getresp 
raise error proto(resp) 
poplib.error proto: -ERR directory status: BAD PASSWORD 
>>> p.user('techNstuff4U') 
'+0K' 
>>> p.pass ('youllNeverGuess') 
'«sOK ready' 
>>> p.stat() 
(102, 2023455) 
»»» rsp, msg, siz = p.retr(102) 
>>> rsp, siz 
('+0K', 480) 
>>> for eachLine in msg: 
... print eachLine 


Date: Mon, 26 Dec 2005 23:58:38 *0000 (GMT) 
Received: from c-42-32-25-43.smtp.python.is.cool 
by python.is.cool (scmrch31) with ESMTP 
id «20051226235837013000r7hhe»; Mon, 26 Dec 2005 
23:58:37 «0000 
From: wesleyG8python.is.cool 
To: wesleyG8python.is.cool 
Subject: test msg 
XXX 


人) 
"FOK pvthou.is.ocool' 


17.4.14 poplib.POP3 类 方法 


POP3 类 有 无 数 的 方法 来 帮助 你 下 载 和 离线 管理 你 的 邮箱 。 最 常用 的 列 在 表 17.4 中 。 
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X 174 POP3 对 象 的 常用 方法 
——— ee 
































^ ti bs id 
user(login) 发 送 用 户 名 login HRAB. HYRA I IE CES LI t 099) 4 9L. 
pass (passwd) ALIE WP passwd 《在 使 用 userf) 登 录 之 局 使 用 ) . MERA., SIME 
stat() 返回 部 和 件 的 状态 ， 个 2 元 组 (msg ct, mbox siz)， 请 和 总 的 数 医 和 消息 的 总 大 小 也 即 字 节 数 
stat() 的 扩 恨 ， 从 恨 务 跨 返 回 一 个 3 元 组 的 消息 列表 (rsp, msg list, rsp_siz) «N96 rx eL 
liss([msgrum]) ^ a &n 845 P A fn 
B. mam". im MX. mam f msgnem 的 话 ， 只 返回 指定 消息 的 数 所 
从 服务 器 中 宕 到 消息 msgnum, RRI ER” 标志, 返回 一 个 3 元 组 (rsp, msglines, msgsiz? : 
retrimrgnum) mpa T7" A ^ + 4A 
I 9 28 RIPE EL. AE msgnum HRANT. Im pum y «e 
dele(msgrum) 起 消息 msgnum 标记 为 剧 除 ， 大 多 数 服 务 器 在 调用 quit() e d Fr INGREDI f 
quití) Buh. Gif C. RI "ik" RI "IMG" ioo , MUDEN. AWER, NIE 


在 登录 时 ，User() 方 法 不 仅 向 服务 器 发 送 了 用 户 名 ， 也 要 等 待 服务 器 正在 等 待 用 户 密码 的 返回 
信息 。 如 果 pass _() 方 法 认证 失败 ， 会 引发 一 个 poplib. error_proto 的 异常 。 如 果 成 功 ， 会 得 到 
一 个 以 +” 号 开头 的 返回 信息 ， 如 “+OK ready”， 然 后 服务 器 上 的 该 邮箱 就 被 锁定 了 ， 直 到 调用 
了 quit() 方 法 为 止 。 

调用 list() 方 法 时 ，msg list 的 格式 为 [msgnum msgsiz',...] ， 其 中 msgnum 和 msgsiz 分 别 是 每 

个 消息 的 编号 和 消息 的 大 小 。 


还 有 一 些 方法 未 被 列 出 ， 想 要 了 解 更 多 信息 ， 请 参考 Python 手册 里 poplib 的 文档 。 


17.4.12 ”客户 端 程序 SMTP 和 POP3 举 例 


下 面 的 例子 演示 了 如 何 使 用 SMTP 和 POP3 来 创建 一 个 既 能 接收 和 下 载 电子 邮件 也 能 上 传 和 发 
送 电 子 邮件 的 客户 端 。 我 们 将 要 先 用 SMTP 发 一 封 电 子 邮 件 给 自己 〈 或 其 他 测试 账户 ) ， 等 待 
一 段 时 间 一 一 我 们 随便 选 了 一 个 时 间 ，10 秒 钟 一 一 然后 使 用 POP3 下 载 这 封 电子 邮件 ， 下 载 下 
来 的 内 容 跟 发 送 的 内 容 应 该 是 完全 一 样 的 。 如 果 程 序 悄 无 声息 地 结束 ， 没 有 输出 也 没有 异 

常 ， 那 就 说 明 我 们 的 操作 都 成 功 了 。 





这 个 脚本 (通过 SMTP 邮 件 服务 器 ) 发 送 一 封 测试 电子 邮件 到 目的 地 址 ， 并 马上 (通过 POP ) 
把 电子 邮件 从 服务 器 上 收回 来 。 要 让 程序 能 正常 工作 ， 你 需要 修改 服务 器 的 名 字 和 电子 邮件 
的 地 址 。 
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$!/usr/bin/env python 


from smtplib import SMTP 
from poplib import POP3 
from time import sleep 


SMTPSVR-'smtp.python.is.cool' 
POP3SVR-'pop.python.is.cool' 


origHdrs = ['From: wesleyG8python.is.cool', 


'To: wesleyGpython.is.cool', 


'Subject: test msg'] 


YYY : 
origMsg = '\r\n\r\n'.join(['\r\n' .join(origHdrs), 


origBody = ['xxx', '»zz?*) 


'NrMn' . join(origBody)]) 


sendSvr = SMTP(SMTPSVR) 

errs = sendSvr.sendmail('wesleyGpython.is.cool', 
('wesley8python.is.cocl',), origMsg) 

sendSvr.quit () 

assert len(errs) == 0, errs 


sleep(10) # wait for mail to be delivered 


recvSvr = POP3(POP3SVR) 

recvSvr.user('wesley') 

recvSvr.pass ('youllNeverGuess') 

rsp, msg, siz = recvSvr.retr(recvSvr.stat ()[0]) 
# strip headers and compare to orig msg 

sep = msg.index('') 

recvBody = msg[sep*1:] 

assert origBody == recvBody # assert identical 


逐 行 解释 


1~8 行 


跟 本 章 前 面 的 例子 一 样 ， 程 序 一 开始 是 一 些 导入 语句 和 常量 的 定义 。 常 量 分 别 是 发 送 邮 件 和 
接收 邮件 的 服务 器 。 


r 
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10 ~ 14 行 


这 几 行 是 消息 内 容 的 准备 工作 。 这 里 ， 我 们 放 了 三 行 消息 头 然后 是 消息 体 。From 和 To 两 个 头 


分 别 表示 消息 。14 行 把 消息 头 和 消息 体 放 在 一 起 组 成 一 个 可 以 发 送 的 消 
息 ， 按 RFC 2822 的 要 求 ， 这 两 部 分 用 空 行 隔 开 。 

16 ~ 21 行 

我 们 连 c ME Ne E 。 这 里 还 有 一 对 From 和 To 的 地 址 ， 这 些 


地 址 是 “真实 "的 电子 邮件 地 址 ， 或 者 说 是 信封 格式 (envlelope) 的 地 址 。 收 件 人 参数 应 该 是 
一 个 可 沈 代 的 对 象 ， 如 果 传 的 是 一 个 字符 串 ， 就 会 被 转 成 一 个 只 有 一 个 元 素 的 列表 。 不 请 自 
来 的 垃圾 邮件 中 ， 消 息 头 和 信封 头 总 是 不 一 致 的 。 


mn 三 个 参数 是 电子 邮件 信息 本 身 。 这 个 函数 返回 之 后 ， 我 们 就 登 出 SMTP 服 务 
， 并 判断 是 否 有 错误 发 生 过 。 rg. 等 待 服务 器 完成 消息 的 发 送 与 接收 。 


23 ~ 30 行 


程序 的 最 后 一 部 分 是 下 载 刚刚 发 送 的 消息 ， 并 断言 发 送 的 和 接收 的 消息 是 完全 一 样 的 。 先 给 
出 用 户 名 和 密码 ， 连 接 到 POP3 服 务 器 ， 在 登录 成 功 后 ， 调 用 stat() 方 法 得 到 有 效 的 消息 的 列 
表 。 我 们 先 选 第 一 条 消息 ([0]) ， 然 后 调用 retr() 下 载 这 个 消息 。 


我 们 用 空 行 来 分 隔 头 和 信息 ， 去 掉头 部 分 ， 比 较 原 始 信 息 体 和 收 到 的 信息 体 。 如 果 它 们 相 
同 ， 什么 都 不 显示 ae d > 会 出 现 一 个 断言 失败 的 错误 。 


由 于 错误 的 类 型 太 多 ， 我 们 在 这 个 脚本 里 不 做 错误 检查 ， 这 样 的 好 处 是 你 可 以 直接 看 到 出 现 
了 什么 错误 。 在 本 章 末 尾 有 一 个 习题 就 是 做 错误 检查 的 。 

现在 ， 你 对 如 何 发 送 和 接收 电子 邮件 有 了 一 个 很 全 面 的 了 解 。 如 果 你 想 深入 了 解 这 一 方面 的 
编程 ， 请 参阅 下 一 章 里 介绍 的 电子 邮件 相关 的 模块 ， 它 们 在 程序 开发 方面 有 相当 大 的 帮助 。 


17.5 相关 模 : 
Python 最 好 的 一 个 方面 就 是 它 在 标 准 库 中 提供 了 相当 的 全 面 的 网 络 支 持 ， 尤 其 在 网 际 协 议和 


客户 端 开 发 方面 的 支持 更 为 全 面 。 下 面 列 出 了 一 些 相关 模块 ， 首 先是 电子 邮件 相关 的 ， 随 后 
是 一 般 用 途 的 网 际 协议 相关 的 。 


17.5.4 电子 邮件 


Python 自 带 了 很 多 电子 邮件 模块 和 包 可 以 帮助 你 创建 应 用 程序 。 表 17.5 中 列 出 了 一 部 分 。 


o ox 
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表 17.5 E-Mail 相关 模块 
mua 4a x 
email 志 子 起 件 处 理 的 包 《 也 支持 MIME) 
ríci22 RFC2822 AB ff 3.94 (i35 
smtpd SMTP 服务 区 
bascós Base 16. 32 和 64 FHMIRE) (RFC 3548) 
mhlib 处 理 MH 文 作 类 和 信息 的 类 
mailbox 支持 mailbox 文件 格式 解析 的 类 
mailcap “mailcap” 文 件 的 处 理 模块 
mimetools 《不 建议 使 用 ) MIME 信息 解析 工具 《使 用 上 面 的 email) 
mimetypes 在 文件 名 现 URL 到 相 美 的 MIME 类 型 之 间 转 换 的 模块 
Mire Writer (不 建议 使 用 ) MIME (f ELAE BEBE: (EEG email) 
mimify 《不 建议 使 用 ) 信息 的 MIME 处 理工 具 《 使 用 上 而 的 emait) 
binascii 二 进 制 和 ASCII 转换 
binhex Binhex 4 «& E) R1 83 ZIF 
17.5.2. Ede p IL 
A 17.6 
HOÀ LEE: 
ftplib FTP fuc e ^ 
gopherlib Gopher Hh i v Pn 
haplib HTTP 和 HTTPS Ih UL ^18 
imaplib IMAP4 Hit P IA 
natplib NNTP 协议 客户 端 
poplib POP3 th UL PN 
smtplib SMTP 协议 客户 端 
telnetlib Telnet f UU NA 


17.6 练习 


FTP 


17-1. 简 单 FTP 客 户 端 。 参 考 本 章 的 FTP 例 子 ， 号 一 个 小 的 FTP 客 户 端 程序 ， 能 够 去 你 喜 
欢 的 网 站 下 载 你 使 用 的 软件 的 最 新 版 本 。 这 个 脚本 应 该 每 几 个 月 就 运行 一 次 ， 以 确保 你 
在 用 的 软件 是 “最 新 和 最 好 的 "。 你 应 该 把 FTP 地 址 ， 登 录 信 息 放 在 一 个 表 里 ， 省 得 每 次 都 
要 修改 。 


17-2. 简 单 FTP 客 户 端 和 模式 匹配 。 在 上 一 个 练习 的 基础 上 创建 一 个 新 的 FTP 客 户 端 程 
序 。 它 可 以 上 传 和 下 载 指定 模式 的 文件 。 比 方 说 ， 如 果 想 把 一 些 Python 的 文件 和 PDF 文 
件 从 一 台电 脑 传 到 另 一 台电 脑 上 ， 那 用 户 可 以 输入 “*.py" 或 “doc*.pdf'， 程 序 会 只 传 这 些 文 
件 名 匹配 的 文件 。 
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17-3. 智 能 FTP 命 令 行 客户 端 程序 。 创 建 一 个 跟 Unix 下 /bin/ftp 类 似 的 命令 行 下 的 FTP 程 
序 ， 不 过 ， 这 个 FTP 客 户 端 要 更 好 一 些 ， 能 提供 更 有 用 的 功能 。 你 可 以 看 看 
http://ncftp.com 的 ncFTP 作 为 样板 。 它 有 以 下 功能 : 历史 记录 、 书 签 (可 以 保存 FTP 地 址 
和 登录 信息 ) 、 下 载 进 度 显示 等 。 你 可 以 使 用 readline 来 记录 历史 命令 ， 用 curses 来 控制 
屏幕 。 


17-4.FTP 和 多 线程 。 创 建 一 个 能 使 用 Python 的 线程 库 下 载 文件 的 FTP 客 户 端 程序 。 你 可 
以 通过 修改 上 一 个 练习 的 程序 或 者 重 写 一 个 简单 的 客户 端 来 下 载 文件 。 你 可 以 在 命令 行 
参数 里 指定 要 下 载 的 文件 ， 也 可 以 做 一 个 GUI， 在 界面 中 让 用 户 选 择 要 下 载 的 文件 。 附 加 
题 : 要 能 支持 模式 ， 如 *.exe。 要 使 用 不 同 的 线程 来 下 载 每 个 文件 。 


17-5.FTP 和 GUI。 在 你 上 面 写 的 FTP 客 户 端 程序 中 加 入 GUI ， 让 你 的 程序 成 为 一 个 完整 的 
FTP 应 用 程序 。 你 可 以 使 用 Python 的 任何 GUI 工具 包 。 


17-6. 子 类 化 。 从 ftplib. FTP 派 生出 一 个 类 FTP2， 在 这 个 类 中 ， 你 不 用 像 之 前 那 4 个 retr*() 
和 stor*() 方 法 中 那样 要 给 定 “STOR filename” 或 “RETR filename” 这 样 的 命令 ， 只 要 传 文件 
名 就 好 了 。 你 可 以 重 写 已 有 的 方法 也 可 以 在 方法 后 加 一 个 2， 如 retrlines2()。Python 发 布 
包 中 有 一 个 Tools/scripts/ftpmirror.py 脚 本 ， 它 使 用 ftplib 模 块 ， 可 以 对 整个 FTP 站 点 或 FTP 
站 点 的 一 部 分 做 镜像 。 它 可 以 作为 ftplib 模 块 应 用 的 扩展 例子 来 使 用 。 解 答 下 面 5 个 问题 

时 ， 可 以 参考 这 个 脚本 。 你 可 以 直接 使 用 ftpmirror py 里 的 代码 ， 也 可 以 以 这 个 脚本 为 样 

板 ， 自 己 重 新 写 一 个 。 


17-7. 递 归 。ftpmirror.py 脚 本 递归 的 复制 一 个 远程 的 目录 。 写 一 个 与 人 pmirror.py 相 似 的 脚 
本 ， 它 的 默认 行为 是 不 递归 的 。 只 有 在 传 入 了 “-r" 参 数 的 时 候 ， 才 递归 的 把 文件 复制 到 本 
地 目录 。 


17-8. 模 式 匹 配 。ftpmirror.py 脚 本 支持 ”-s”" 参 数 让 用 户 指 定 能 匹配 模式 的 文件 不 下 载 ， 
如 %*.eXe”。 重 新 写 一 个 简单 的 FTP 客 户 端 程序 或 修改 之 前 的 程序 ， 实 现 让 用 户 指定 通 配 
符 程 序 只 下 载 能 匹配 模式 的 文件 。 可 以 在 你 之 前 练习 的 答案 基础 上 实现 。 


17-9. 递 归 和 模式 匹配 。 写 一 个 FTP 客 户 端 程序 ， 把 上 面 两 个 练习 的 脚本 集成 在 一 起 。 


17-10. 递 归 和 ZIP 文 件 。 这 个 练习 与 上 面 的 第 一 个 递归 练习 有 些 相 似 ， 只 是 不 再 直接 把 文 
件 下 载 到 本 地 文件 系统 ， 而 是 文件 下 载 后 压缩 到 一 个 ZIP (或 TGZ， 或 BZ2) 文件 中 。 同 
样 ， 你 可 以 在 之 前 脚本 的 基础 上 改 ， 也 可 以 重 写 一 个 。 使 用 "-z” 参 数 让 用 户 可 以 自动 地 备 
份 一 个 FTP 站 点 。 


17-11. 集 成 。 实 现 一 个 最 终 的 ， 全 功能 的 FTP 应 用 程序 ， 包 含 上 面 几 个 练习 的 所 有 功能 。 
即 ， 支 持 “-r”“-s”" 和 “-z” 参 数 。 


NNTP 


17-12.NNTP 介 绍 。 修 改 例 17.2 (getLatestNNTP.py) ， 让 它 显示 第 一 封 (而 不 是 最 后 一 
封 ) 有 效 文章 的 有 意义 的 内 容 。 
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17-13. 代 码 改 进 。 修 正 getLatestNNTP.py 的 会 输出 3 次 引用 问题 ， 这 是 因为 我 们 想 输出 
Python 交互 解释 的 内 容 ， 而 不 是 被 3 次 引用 的 文本 。 用 检查 “>>>" 后 的 代码 是 否 为 合法 
Python 代码 的 方式 来 解决 这 个 问题 。 如 果 合 法 ， 那 就 显示 这 一 行 数据 ， 如 果 不 合 法 ， 认 
为 是 引用 文本 ， 不 显示 。 附 加 题 : 你 的 解决 方案 再 解决 这 样 一 个 小 问题 : 我 们 没有 去 掉 
前 导 的 空格 ， 因 为 它 可 能 是 Python 代码 的 缩 进 。 如 果 引 的 是 代码 的 缩 进 ， 就 显示 它 ， 否 
则 ， 认 为 它 是 一 般 的 文本 ， 先 对 字符 串 用 lstrip() 方 法 处 理 后 再 显示 。 


17-14. 查 找 文章 。 写 一 个 NNTP 客 户 端 程序 ， 让 用 户 能 选择 并 登录 感 兴趣 的 新 闻 组 。 在 登 
录 成 功 后 ， 提 示 用 户 输 入 一 些 关键 字 ， 使 用 这 些 关键 字 来 查找 文章 的 标题 。 把 符合 要 求 
的 文章 列 出 来 显示 给 用 户 。 用 户 可 以 在 列表 中 选择 某 一 篇 文章 进行 阅读 ， 这 时 要 能 显示 
选 定 文章 的 内 容 。 程 序 还 要 有 简单 的 导航 功能 ， 如 分 页 等 。 如 果 没 有 给 出 搜索 关键 字 ， 
则 显示 所 有 的 文章 。 


17-15. 搜 索 内 容 。 修 改 上 一 题 你 的 脚本 ， 让 脚本 同时 搜索 主题 和 文章 内 容 。 人 允许 关键 字 
的 “与 ”(AND ) 和 “或 ”(OR) 的 操作 。 也 要 允许 指定 在 标题 和 文章 内 容 的 “与 ”( AND) 
FER? (OR) 即 ， 关 键 字 要 只 在 标题 里 出 现 ， 只 在 内 容 里 出 现 或 两 者 里 面 都 要 出 现 。 


17-16. 线 索 化 的 新 闻 阅 读 工具 。 把 不 同 的 回帖 组 织 到 一 个 “文章 线索 "中 。 也 就 是 说 ， 把 相 
关 的 文章 放 在 一 起 ， 与 文章 什么 时 候 发 的 没有 关系 。 同 一 个 线索 中 的 文章 按时 间 顺 序 排 
5|.mpqau: 


(a) 选择 某 一 篇 文章 进行 阅读 ， 然 后 可 以 选择 回 到 文章 列表 ， 顺 序 阅 读 当前 线索 的 
140203 € 


(b) 允许 回复 线索 ， 可 以 选择 复制 并 引用 之 前 文章 ， 用 跟 贴 的 方式 回复 到 整个 新 闻 
组 。 附 加 题 : 也 允许 私下 用 电子 邮件 进行 回复 。 


(c) 永久 地 删除 线索 ， 即 后 续 的 相关 文章 不 会 在 文章 列表 中 显示 。 要 实现 这 个 功 
能 ， 你 应 该 把 要 删除 的 文章 的 列表 暂时 记录 下 来 。 一 个 线索 在 几 个 月 之 后 还 没有 人 
回复 的 话 ， 你 可 以 认为 这 个 线索 已 经 死 了 。 


17-17.GUI 新 闻 阅 读 工具 。 跟 上 面 的 FTP 练 习 差 不 多 ， 选 择 一 个 GUI 工具 包 来 实现 一 个 完 
整 的 、 独 立 的 GUI 新 闻 阅 读 工 具 。 


17-18. 重 构 。 跟 FTP 的 ftpmirror py 一 样 ，NNTP 也 有 一 个 示例 脚本 : 
Demo/scripts/newslist. py ° 运行 它 。 这 个 脚本 在 很 久之 前 就 写 好 了 ， Wd 
工作 。 作 为 练习 ， 你 要 用 Python 新 版 本 的 一 些 特 性 和 你 的 Python 开发 技巧 来 重 构 这 个 

本 ， 让 这 个 脚本 运行 得 更 快 。 你 可 以 使 用 列表 解析 和 生成 器 表达 式 ， 用 更 智和 le 
连接 而 不 是 调用 不 必要 的 函数 等 。 


17-19. 缓 冲 。 如 其 作者 所 说 ，newslist.py 的 另 一 个 问题 是 ，"“ 我 应 该 把 要 忽略 的 空 的 新 闻 
组 的 列表 保存 下 来 ， 在 每 次 运行 的 时 候 检 查 一 下 是 否 有 新 的 文章 ， 但 我 真 的 抽 不 出 时 
闻 ”。 你 来 实现 这 个 功能 。 你 可 以 直接 修改 它 ， 也 可 以 修改 你 之 前 的 脚本 。 电 子 邮 件 
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17- T 标识 符 Ra I EN 于 在 调用 /ogin() 方 法 传 了 用 户 名 之 后 传递 密码 。 你 
能 说 出 ， 为 什么 这 个 方法 命名 时 要 在 后 面 加 一 个 下 划 线 ， 即 %ass()”， 而 不 
是 E i 


17-21.IMAP。 现 在 ， 你 已 经 熟悉 了 POP 是 怎么 工作 的 。 这 方面 的 经 验 对 你 写 一 个 IMAP 
客户 端 程序 也 是 有 帮助 的 。 研 究 一 下 IMAP 协 议 的 RFC 文 档 ， 使 用 Python 的 imaplib 模 块 来 
实现 一 个 IMAP 客 户 端 程序 。 


下 面 的 练习 题 跟 本 章 ( 例 17.3) 中 的 myMail.py 程 序 有 关 。 


17-22. 电 子 邮 件 头 。 在 myMail.py 的 最 后 几 行 ， 比 较 了 发 送 的 信息 体 与 接收 到 的 电子 邮件 
的 信息 体 。 写 一 段 相 似 的 代码 ， 比 较 信息 头 。 注 意 ， 要 忽略 新 加 入 的 头 。 


17-23. 错 误 检 查 。 加 入 SMTP 和 POP3 的 错误 检查 。 


17-24.SMTP 和 IMAP。 在 简单 的 myMail.py 中 ， 加 入 IMAP 的 支持 。 附 加 题 : 支持 两 种 邮 
件 下 载 协议 ， 让 用 户 选择 要 使 用 哪 一 种 协议 。 


17-25. 撰 写 电 子 邮 件 。 再 次 扩展 你 之 前 的 程序 ， 人 允许 用 户 撰 写 和 发 送 电子 邮件 。 


17-26. 电 子 邮 件 应 用 程序 。 再 次 扩展 你 的 电子 邮件 应 用 程序 ， 在 其 中 加 入 更 有 用 的 邮箱 
管理 功能 。 你 的 程序 要 能 读 出 当前 所 有 电子 邮件 的 信息 ， 并 显示 其 主题 。 用 户 可 以 选择 
想 要 看 的 邮件 。 附 加 题 : 要 能 支持 用 外 部 程序 查看 附件 8 


17-27. GUI 。 给 你 的 脚本 加 入 GUI 的 功能 ， 让 它 成 为 一 个 实用 的 完整 的 电子 邮件 应 用 程 
Æ o 


17-28. 垃 圾 邮件 的 特点 。 不 请 自 来 的 垃圾 邮件 (spam) 是 当今 的 一 大 问题 。 所 幸 ， 针 对 
这 个 问题 有 不 少 好 的 解决 方案 。 我 们 不 用 你 来 重新 发 明 轮 子 ， 我 们 想 让 你 了 解 一 些 垃圾 
邮件 的 特点 。 
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(a) “mbox” 格 式 。 在 开始 之 前 ， 我 们 要 把 你 想 处 理 的 电子 邮件 信息 转 为 一 个 公共 
的 格式 。 


比如 “mbox" 格 式 。 (如 果 你 愿意 ， 你 也 可 以 使 用 别 的 格式 。) 如 果 你 已 经 有 了 一 些 
mbox 格 式 的 消息 ， 把 它们 合并 到 一 个 文件 中 。 


(b) 头 。 很 多 电子 邮件 的 头 上 就 看 出 有 垃圾 邮件 的 线索 。 (你 可 以 用 email 包 或 自 
己 解析 头 ) 。 写 一 段 代码 来 回答 以 下 问题 : 


-发 送 这 个 消息 的 电子 邮件 客户 端 软 件 是 什么 ? (检查 X-Mailer 头 ) 
- 报 文 ID (Message-IDX ) 的 格式 是 否 合法 ? 


-From, Received 和 Return-Path 头 的 域名 是 否 不 匹配 ? 域名 和 IP 地 址 是 否 不 匹配 ? 
有 没有 X-Authentication-Warning 头 ? 如 果 有 的 话 ， 内 容 是 什么 ? 


(c) 信息 服务 器 。 一 些 服务 器 如 WHOIS, SenderBase.org 等 可 以 根据 IP 地 址 或 域名 
帮助 你 找到 电子 邮件 来 自 何 方 。 找 到 一 些 这 样 的 服务 ， 写 一 些 代码 来 得 到 来 源 地 的 
国 别 、 城 市 、 网 络 所 有 者 的 名 字 、 联 系 方 法 等 。 


(d) 关键 字 。 垃 圾 邮件 中 ， 有 一 些 字 经 常 出 现 。 你 之 前 一 定 见 过 ， 它 们 是 单个 的 字 
母 ， 开 头 大 写 的 随机 字母 等 。 把 你 常见 的 一 些 大 量 在 垃圾 邮件 中 出 现 的 词汇 放 在 一 
个 列表 中 。 把 出 现 了 这 些 词 汇 的 邮件 作为 疑似 垃圾 邮件 隔离 。 附 加 题 : 设计 一 种 算 
法 或 加 入 一 些 关键 字 的 变形 来 找 出 这 些 邮件 。 


(e) 钓鱼 。 这 些 垃圾 邮件 总 是 想 把 他 们 伪装 成 来 自 大 银行 或 某 个 知名 的 网 站 的 合法 
的 电子 邮件 。 里 面包 含 某 种 链接 ， 引 诱 用 户 输 入 自己 私密 的 或 是 敏感 的 信息 ， 如 登 
录用 户 名 、 密 码 和 信用 卡 的 卡号 等 。 这 些 骗子 往往 做 得 足以 以 假 乱 真 。 不 过 ， 他 们 
还 是 免不了 要 让 用 户 登 录 到 与 他 们 声称 的 并 不 相符 的 网 站 。 这 里 ， 就 可 能 会 透露 出 
很 多 信息 ， 如 ， 看 上 去 很 乱七八糟 的 域名 ， 只 用 了 IP 地 址 ， 或 是 32 位 整 型 形式 而 不 
是 字 节 形式 的 IP 地 址 等 。 写 一 段 代 码 来 判断 一 封 看 上 去 像 正 式 交 流 的 电子 邮件 是 旧 
的 还 是 假 的 。 

其 他 
可 以 在 
http://www.networksorcery.com/enp/topic/ipsuite.htm#Application%201ayer%20pro 


tocols 找 到 包含 本 章 中 所 列 的 那些 协议 在 内 的 各 种 网 际 协议 的 列表 。Python (3 
前 ) 所 支持 的 网 际 协议 列表 可 以 在 http://docs.python.org/lib/internet.html 找 到 。 


17-29. 开 发 其 他 因特网 客户 端 程 序 。 现 在 ， 你 已 经 看 到 了 4 个 Python 开 发 因特网 客户 端 程 
序 的 例子 。 选 一 种 Python 标 准 库 中 支持 的 其 他 协议 ， 开 发 一 个 对 应 的 客户 端 程序 。 


17-30.* 开 发 一 种 新 的 因特网 客户 端 程序 。 这 个 难度 比较 大 : 找到 一 个 不 常用 的 ， 或 是 还 
未 成 型 的 Python 尚未 支持 的 协议 ， 实 现 它 。 如 果 做 得 好 的 话 ， 你 可 以 考虑 提交 一 个 
PEP， 把 你 的 实现 加 入 到 以 后 版 本 Python 的 标准 库 中 发 布 。 
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第 18 章 ”多 线程 编程 


本 章 主 题 

4 引言 /动机 

4 线程 和 进程 

+ 线程 和 Python 

€ thread 模 块 

4 threading 模 块 

e 生产 者 -消费 者 问题 和 Queue 模 块 

e. 相关 模块 

本 章 中 ， 我 们 将 探索 在 Python 中 ， 用 多 线程 编程 技术 实现 代码 并 行 性 的 几 种 不 同 的 方法 。 在 
前 面 几 节 中 ， 我 们 将 介绍 进程 与 线程 的 区 别 。 然 后 介绍 多 线程 编程 的 概念 (已 经 熟悉 多 线程 


编程 的 读者 可 以 直接 跳 到 第 18.3.5 节 ) 。 本 章 的 最 后 几 节 将 演示 在 Python 中 如 何 使 用 
threading 和 Queue 模 块 来 实现 多 线程 编程 。 


18.1 引言 /动机 


在 多 线程 (multithreaded, MT) 编程 出 现 之 前 ， 电 脑 程序 的 运行 由 一 个 执行 序列 组 成 ， 执 行 
序列 按 顺序 在 主机 的 中 央 处 理 器 (CPU) 中 运行 。 无 论 是 任务 本 身 要 求 顺序 执行 还 是 整个 程 
序 是 由 多 个 子 任务 组 成 ， 程 序 都 是 按 这 种 方式 执行 的 。 即 使 子 任务 相互 独立 ， 互 相 无 关 

( 即 ， 一 个 子 任务 的 结果 不 影响 其 他 子 任 务 的 结果 ) 时 也 是 这 样 。 这 样 是 不 是 有 点 不 合 逻 
n dn 这 些 相互 独立 的 子 任务 呢 ? 这样 的 并 行 处 理 可 以 大 幅度 地 提升 整个 
任务 的 效率 。 是 多 线程 编程 的 目的 。 


多 线程 编程 对 于 某 些 任务 来 说 是 最 理想 的 。 这 些 任务 具有 以 下 特点 : 它们 本 质 CH M 
的 ， 需 要 有 多 个 并 发 事务 ， 云 行 顺序 可 以 是 不 确定 的 、 随 机 的 、 不 可 预测 的 。 
样 的 编程 任务 可 以 被 分 成 多 个 执行 流 ， 每 个 流 都 有 一 个 要 完成 的 目标 。 根 据 应 用 的 不 同 ， 
些 子 任务 可 能 都 要 计算 出 一 个 中 间 结 果 ， pon 最 后 的 结果 。 


运算 密集 型 的 任务 一 般 都 比较 容易 分 隔 成 多 个 子 任务 ， 可 以 顺序 执行 或 以 多 线程 的 方式 执 
。 单 线程 处 理 多 个 外 部 输入 源 的 的 任务 就 不 是 那么 容易 了 。 这 种 编程 任务 如 果 不 用 多 线程 
方式 处 理 ， 则 一 定 要 使 用 一 个 或 多 个 计时 器 来 实现 。 


一 个 顺序 执行 的 程序 要 从 每 个 JO (输入 /输出 ) 终端 信道 检查 用 户 的 输入 时 ， 程 序 无 论 如 何 也 
不 能 在 读 取 J/O 终 端 信道 的 时 候 阻塞 。 因 为 用 户 输入 的 到 达 是 不 确定 的 ， 阻 塞 会 导致 其 他 IO 信 
息 的 数据 不 能 被 处 理 。 顺 序 执行 的 程序 必须 使 用 非 阻塞 MO， 或 是 带 有 计时 器 的 阻塞 MO (这 样 
才能 保证 阻塞 只 是 暂时 的 ) 。 


由 于 顺序 执行 的 程序 只 有 一 个 线程 在 运行 。 它 要 保证 它 要 做 的 多 任务 ， 不 会 有 某 个 任务 占用 
大 多 的 时 间 ， 而 且 要 合理 地 分 配 用 户 的 响应 时 间 。 执 行 多 任务 的 顺序 执行 的 程序 一 般 程序 控 
制 流程 都 很 复杂 ， 难 以 理解 。 


使 用 多 线程 编程 和 一 个 共享 的 数据 结构 如 Queue (本 章 后 面 会 介绍 的 一 种 多 线程 队列 数据 结 
构 ) ， 这 种 程序 任务 可 以 用 几 个 功能 单一 的 线程 来 组 织 。 


e UserRequestThread : 负责 读 取 客户 的 输入 ， 可 能 是 一 个 |/O 信 道 。 程 序 可 能 创建 多 个 线 
程 ， 每 个 客户 一 个 ， 请 求 会 被 放 入 队列 中 。 


e RequestProcessor : 一 个 负责 从 队列 中 获取 并 处 理 请 求 的 线程 ， 它 为 下 面 那 种 线程 提供 
输出 。 


e ReplyThread : 负责 把 给 用 户 的 输出 取出 来 ， 如 果 是 网 络 应 用 程序 就 把 结果 发 送出 去 ， 否 
则 就 保存 到 本 地 文件 系统 或 数据 库 中 。 


把 这 种 编程 任务 用 多 线程 来 组 织 可 以 降低 程序 的 复杂 度 ， 并 使 得 干净 、 有 效 和 具有 良好 组 织 
的 程序 结构 实现 变 得 可 能 。 每 个 线程 的 逻辑 都 不 会 很 复杂 ， 因 为 它 要 做 的 事情 很 清楚 。 例 

如 ，UserRequestThread 只 是 从 用 户 或 某 个 数据 源 读 取 数据 ， 放 到 一 个 队列 中 ， 等 待 其 他 线 
程 进一步 的 处 理 ， 等 等 ， 每 个 线程 都 有 自己 明确 的 任务 。 你 只 要 设计 好 每 个 线程 要 做 什么 ， 

并 把 要 做 的 事 做 好 就 可 以 了 。 对 某 些 任 务 使 用 线程 跟 享 利 。 福 特制 造 汽 车 时 使 用 的 流水 线 模 型 
有 些 相似 。 


18.2 线程 和 进程 


18.2.1 什么 是 进程 


计算 机 程序 只 不 过 是 磁盘 中 可 执行 的 二 进 制 (或 其 他 类 型 ) 的 数据 。 它 们 只 有 在 被 读 取 到 内 
存 中 ， 被 操作 系统 调用 的 时 候 才 开始 它们 的 生命 期 。 进 程 (有 时 被 称 为 重量 级 进程 ) 是 程序 
的 一 次 执行 。 每 个 进程 都 有 自己 的 地 址 空间 、 内 存 、 数 据 栈 及 其 他 记录 其 运行 轨迹 的 辅助 数 
据 。 操 作 系统 管理 在 其 上 运行 的 所 有 进程 ， 并 为 这 些 进程 公平 地 分 配 时 间 、 进 程 也 可 以 通过 
fork 和 spawn 操 作 来 完成 其 他 的 任务 。 不 过 各 个 进程 有 自己 的 内 存 空 间 、 数 据 栈 等 ， 所 以 只 能 
使 用 进程 间 通讯 (interprocess communication, IPC) ， 而 不 能 直接 共享 信息 。 


线程 (有 时 被 称 为 轻 量 级 进程 ) 跟 进 程 有 些 相 似 ， 不 同 的 是 ， 所 有 的 线程 运行 在 同一 个 
中 ， 共 享 相同 的 运行 环境 。 它 们 可 以 被 想象 成 是 在 主 进程 或 "主线 程 "中 并 行 运行 的 "迷你 


程 "。 


线程 有 开始 ， 顺 序 执行 和 结束 三 部 分 。 它 有 一 个 自己 的 指令 指针 ， 记 录 自 己 运行 到 什么 地 

方 。 线 程 的 运行 可 能 被 抢占 (中断 ) ， 或 暂时 的 被 挂 起 (WAER) ， 让 其 他 的 线程 运行 ， 
这 叫做 让 步 。 一 个 进程 中 的 各 个 线程 之 间 共 享 同一 片 数据 空间 ， 所 以 线程 之 间 可 以 比 进程 之 
间 更 方便 地 共享 数据 以 及 相互 通讯 。 线 程 一 般 都 是 并 发 执行 的 ， 正 是 由 于 这 种 并 行 和 数据 共 
享 的 机 制 使 得 多 个 任务 的 合作 变 为 可 能 。 实 际 上 ， 在 单 CPU 的 系统 中 ， 站 正 的 并 发 是 不 可 能 
的 ， 每 个 线程 会 被 安排 成 每 次 只 运行 一 小 会 儿 ， 然 后 就 把 CPU 让 出 来 ， 让 其 他 的 线程 去 运 

行 。 在 进程 的 整个 运行 过 程 中 ， 每 个 线程 都 只 做 自己 的 事 ， 在 需要 的 时 候 跟 其 他 的 线程 共享 
运行 的 结果 。 


当然 ? 这 样 的 共享 并 不 是 完全 没有 危险 的 o 如 果 多 个 线程 共同 访问 同一 片 数据 j 则 由 于 数据 
访问 的 顺序 不 一 样 ， 有 可 能 导致 数据 结果 的 不 一 致 的 问题 。 这 叫做 竞 态 条 件 (race 
condition) 。 幸 运 的 是 ， 大 多 数 线程 库 都 带 有 一 系列 的 同步 原 语 ， 来 控制 线程 的 执行 和 数据 
的 访问 。 


另 一 个 要 注意 的 地 方 是 ， 由 于 有 的 函数 会 在 完成 之 前 阻塞 住 ， 在 没有 特别 为 多 线程 做 修 改 的 
情况 下 ， 这 种 “ 贪 焚 ? 的 函数 会 让 CPU 的 时 间 分 配 有 所 倾斜 。 导 致 各 个 线程 分 配 到 的 运行 时 间 可 
能 不 尽 相 同 ， 不 尽 公 平 。 


18.3 Python 、 线 程 和 全 局 解释 器 锁 


18.3.1 全 局 解释 器 锁 (GIL) 


Python 代码 的 执行 由 Python 诬 拟 机 (也 叫 解释 器 主 循环 ) 来 控制 。Python 在 设计 之 初 就 考虑 
到 要 在 主 循环 中 ， 同 时 只 有 一 个 线程 在 执行 ， 就 像 单 CPU 的 系统 中 运行 多 个 进程 那样 ， 内 存 
中 可 以 存放 多 个 程序 ， 但 任意 时 刻 ， 只 有 一 个 程序 在 CPU 中 运行 。 同 样 地 ， 虽 然 Python 解 释 
器 中 可 以 “运行 "多 个 线程 ， 但 在 任意 时 刻 ， 只 有 一 个 线程 在 解释 器 中 运行 。 


对 Python 虚 拟 机 的 访问 由 全 局 解释 器 锁 (global interpreter lock, GIL) 来 控制 ， 正 是 这 个 锁 能 
保证 同一 时 刻 只 有 一 个 线程 在 运行 。 在 多 线程 环境 中 ，Python 庶 拟 机 按 以 下 方式 执行 。 


1. 设 置 GIL。 
2. 切 换 到 一 个 线程 去 运行 。 
3. 运 行 : 

a. 指 定数 量 的 字 节 码 的 指令 ， 或 者 

b. 线 程 主动 让 出 控制 (可 以 调用 time.sleep (0) ) 


4. 把 线程 设置 为 睡眠 状态 。 


5. AE GIL ° 
6. 再 次 重复 以 上 所 有 步骤 。 


在 调用 外 部 代码 (如 C/C++ 扩展 函数 ) 的 时 候 ，GIL 将 会 被 锁定 ， 直 到 这 个 函数 结束 为 止 (由 
于 在 这 期 间 没 有 Python 的 字 节 码 被 运行 ， 所 以 不 会 做 线程 切换 ) 。 编 写 扩展 的 程序 员 可 以 主 
动 解锁 GIL。 不 过 ，Python 的 开发 人 员 则 不 用 担心 在 这 些 情况 下 你 的 Python 代码 会 被 锁 住 。 


例如 ， 对 所 有 面向 MO 的 (会 调用 内 建 的 操作 系统 C 代 码 的 ) 程序 来 说 ，GIL 会 在 这 个 |/O 调 用 
之 前 被 释放 ， 以 允许 其 他 的 线程 在 这 个 线程 等 待 JO 的 时 候 运行 。 如 果 某 线程 并 未 使 用 很 多 IO 
操作 ， 它 会 在 自己 的 时 间 片 内 一 直 占 用 处 理 器 (和 GIL) 。 也 就 是 说 ，1/O 密 集 型 的 Python 程 
序 比 计算 密集 型 的 程序 更 能 充分 利用 多 线程 环境 的 好 处 。 


对 源 代码 ， 解 释 器 主 循环 和 GIL 感 兴趣 的 人 ， 可 以 看 看 Python/ceval.c 文 件 o 


18.3.2 退出 线程 


当 一 个 线程 结束 计算 ， 它 就 退出 了 。 线 程 可 以 调用 thread.exit() 之 类 的 退出 函数 ， 也 可 以 使 用 
Python 退 出 进程 的 标准 方法 ， 如 sys.exit() 或 抛 出 一 个 SystemExit 异 常 等 。 不 过 ， 你 不 可 以 直 
接 “ 杀 掉 ”(kill) 一 个 线程 。 


在 下 面 一 节 中 ， 我 们 将 要 讨论 两 个 跟 线 程 有 关 的 模块 。 这 两 个 模块 中 ， 我 们 不 建议 使 用 thread 
模块 。 这 样 做 有 很 多 原因 ， 很 明显 的 一 个 原因 是 ， 当 主线 程 退 出 的 时 候 ， 所 有 其 他 线程 没有 
被 清除 就 退出 了 。 但 另 一 个 模块 threading 就 能 确保 所 有 “重要 的 " 子 线程 都 退出 后 ， 进 程 才 会 结 
Ro (我 们 等 一 会 儿 会 详细 说 明 什 么 叫 “ 重 要 的 "， 请 参阅 守护 线程 的 “核心 提示 ”) 。 


主线 程 应 该 是 一 个 好 的 管理 者 , 它 要 了 解 每 个 线程 都 要 做 些 什么 事 ， 线程 都 需要 什么 数据 和 
什么 参数 ， 以 及 在 线程 结束 的 时 候 ， 它 们 都 提供 了 什么 结果 。 这 样 ， 主 线程 就 可 以 把 各 个 线 
程 的 结果 组 合成 一 个 有 意义 的 最 后 结果 。 


18.3.3 ”在 Python 中 使 用 线程 


在 Win32 和 Linux, Solaris, MacOS, *BSD 等 大 多 数 类 Unix 系 统 上 运行 时 ，Python 支 持 多 线程 纺 
程 。Python 使 用 POSIX 兼 容 的 线程 ， 即 pthreads。 


默认 情况 下 ， 从 源 代码 编译 的 (2.0 及 以 上 版 本 的 ) Python 以 及 Win32 的 安装 包 里 ， 线 程 支 持 
是 打开 的 。 想 要 从 解释 器 里 判断 线程 是 否 可 用 ， 只 要 简单 地 在 交互 式 解释 器 里 尝试 导入 thread 
模块 就 行 了 ， 只 要 没 出 现 错误 就 表示 线程 可 用 。 


>>> import thread 
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如 果 你 的 Python 解释 器 在 编译 时 ， 没 有 打开 线程 支持 ， 导 入 模块 会 失败 : 


>>> import thread 
Traceback (innermost last): 
File "«stdin»", line 1, in ? 
ImportError: No module named thread 
这 种 情况 下 ， 你 就 要 重新 编译 你 的 Python 解释 器 才能 使 用 线程 。 你 可 以 在 运行 配置 脚本 的 时 


候 ， 加 上 “-with-thread" 参 数 。 参 考 你 的 发 布 版 的 README 文 件 ， 以 获取 如 何 编译 支持 线程 的 
Python 的 相关 信息 。 


18.3.4 没有 线程 支持 的 情况 


第 一 个 例子 中 ， 我 们 会 使 用 time. sleep() 函 数 来 演 me 是 怎样 工作 的 。time.sleep() 需 要 一 个 
浮 点 型 的 参数 ， 来 指定 “睡眠 ”的 时 间 (以 秒 为 单位 ) 。 这 就 意味 着 ， 程 序 的 运行 会 被 挂 起 指定 
的 时 间 。 


我 们 要 创建 两 个 "计时 循环 "。 一 个 睡眠 4 秒 种 ， 一 个 睡眠 2 秒 种 ， 分 别 是 loop0() 和 loopl()。 (我 
们 命名 为 “loop0”" 和 “loop1” 表 示 我 们 将 有 一 个 循环 的 序列 ) 。 如 果 我 们 像 例 18. 1 的 onethr py 中 
那样 ， 在 一 个 进程 或 一 个 线程 中 ， 顺 序 地 执行 loop0() 和 loop1()， 那 运行 的 总 时 间 为 6 秒 。 在 启 
动 loop0(),loop1() 和 其 他 的 代码 时 ， 也 要 花 去 一 些 时 间 ， 所 以 ， 我 们 看 到 的 总 时 间 也 有 可 能 会 
是 7 秒 钟 。 


在 单线 程 中 顺序 执行 两 个 循环 。 一 个 循环 结束 后 ， 另 一 个 才能 开始 。 总 时 间 是 各 个 循环 运行 
时 间 之 和 。 


例 18.1 


MF! /usr/bin/env python 


3 from time import sleep, ctime 


4 

- def loopO0(): 

6 print 'start loop 0 at:', ctime() 
7 sleep(4) 

8 print 'loop 0 done at:', ctime() 
10 def loop1(0): 

11 print 'start loop 1 at:', ctime() 
12 sleep(2) 

13 print 'loop 1 done at:', ctime() 
14 


15 def main(): 


16 print 'starting at:', ctime() 

17 loop0 t) 

18 looplt() 

19 print 'all DONE at:', ctime() 
if name == ' main 

22 maint() 


我 们 可 以 通过 运行 onethr.py 来 验证 这 一 点 ， 下 面 是 运行 的 输出 : 


$ onethr.py 

starting at: Sun Aug 13 05:03:34 2006 
start loop 0 at: Sun Aug 13 05:03:34 2006 
loop 0 done at: Sun Aug 13 05:03:38 2006 
start loop 1 at: Sun Aug 13 05:03:38 2006 
loop 1 done at: Sun Aug 13 05:03:40 2006 
all DONE at: Sun Aug 13 05:03:40 2006 


假定 loop0() 和 |oop1() 里 做 的 不 是 睡眠 ， 而 是 各 自 独立 的 ， 不 相关 的 运算 ， 各 自 的 运算 结果 到 
最 后 将 会 汇总 成 一 个 最 终 的 结果 。 这 时 ， 如 果 能 让 这 些 计算 并 行 执 行 的 话 ， 那 不 是 可 以 减少 
总 的 运行 时 间 吗 ? 这 就 是 我 们 现在 要 介绍 的 多 线程 编程 的 前 提 条 件 。 


18.3.5 ”Python 的 threading 模 块 


Python 提 供 了 几 个 用 于 多 线程 编程 的 模块 ， 包 括 thread、threading 和 Queue 等 。thread 和 
threading 模 块 允许 程序 员 创 建 和 管理 线程 。thread 模 块 提供 了 基本 的 线程 和 锁 的 支持 ， 而 
threading 提 供 了 更 高 级 别 ， 功 能 更 强 的 线程 管理 的 功能 。Queue 模 块 允许 用 户 创建 一 个 可 以 
用 于 多 个 线程 之 间 共 享 数 据 的 队列 数据 结构 。 我 们 将 分 别 介 绍 这 几 个 模块 ， 并 给 出 一 些 例子 
和 中 等 大 小 的 应 用 。 





核心 提示 : 避免 使 用 thread 模 块 


出 于 以 下 几 点 考虑 ， 我 们 不 建议 您 使 用 thread 模 块 。 首 先 ， 更 高 级 别 的 threading 模 块 更 为 先 
进 ， 对 线程 的 支持 更 为 完善 ， 而 且 使 用 thread 模 块 里 的 属性 有 可 能 会 与 threading 出 现 冲 突 。 
其 次 ， 低 级 别 的 thread 模 块 的 同步 原 语 很 少 (实际 上 只 有 一 个 ) ， 而 threading 模 块 则 有 很 


多 。 


不 过 ， 出 于 对 学 习 Python 和 线程 的 兴趣 ， 我 们 将 给 出 一 点 使 用 thread 模 块 的 例子 。 这 些 代 码 
只 用 于 学 习 目 的 ， 让 你 对 为 什么 应 该 避免 使 用 thread 模 块 有 更 深 的 认识 ， 以 及 让 你 了 解 在 把 代 
码 改 为 使 用 threading 和 Queue 模 块 时 ， 我 们 能 获得 多 大 的 便利 。 


另 一 个 不 要 使 用 thread 原 因 是 ， 对 于 你 的 进程 什么 时 候 应 该 结束 完全 没有 控制 ， 当 主线 程 结束 
时 ， 所 有 的 线程 都 会 被 强制 结束 掉 ， 没 有 警告 也 不 会 有 正常 的 清除 工作 。 我 们 之 前 说 过 ， 至 
少 threading 模 块 能 确保 重要 的 子 线程 退出 后 进程 才 退 出 。 

只 建议 那些 有 经 验 的 专家 在 想 访 问 线 程 的 底层 结构 的 时 候 ， 才 使 用 thread 模 块 。 而 使 用 线程 的 
新 手 们 则 应 该 看 看 我 们 是 如 何 把 线程 应 用 到 我 们 的 第 一 个 程序 ， 从 而 增加 代码 的 可 读 性 ， 以 
及 第 一 段 例子 如 何 进 化 到 我 们 本 章 的 主要 的 代码 的 。 如 果 可 以 的 话 ， 你 的 第 一 个 多 线程 程序 
应 该 尽 可 能 地 使 用 threading 等 高 级 别 的 线程 模块 。 


18.4 thread 模块 


我 们 先 看 看 thread 模 块 都 提供 了 些 什 么 。 除 了 产生 线程 外 ，thread 模 块 也 提供 了 基本 的 同步 数 
据 结 构 锁 对 象 (lock object， 也 叫 原 语 锁 、 简 单 锁 、 互 斥 锁 、 互 斥 量 、 二 值 信号 量 ) 。 如 之 前 
所 说 ， 同 步 原 语 与 线程 的 管理 是 密 不 可 分 的 。 


表 18.1 中 所 列 的 是 常用 的 线程 函数 以 及 LockType 类 型 的 锁 对 象 的 方法 。 
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start new thread()&Zc thread 2X 84 — 4- X ££ Jc» 8 8 7X A E apply) AAA 
DUDEN 函数 的 参 Toe 的 关键 字 参 数 。 不 同 的 是 ， 函 数 不 是 在 主线 程 里 
运行 ， 而 是 产生 一 个 新 的 线程 来 运行 这 个 函数 。 


现在 ， 把 线程 加 入 到 我 们 的 onethr.py 例 子 中 。 稍 微 改 变 一 下 loop*() 函 数 的 调用 方法 ， 我 们 得 
到 了 例 18.2 的 mtsleepl.py。 


这 儿 执 行 的 是 和 onethr.py 中 一 样 的 循环 ， 不 同 的 是 ， 这 一 次 我 们 使 用 的 是 thread 模 块 提 供 的 
简单 的 多 线程 的 机 制 。 两 个 循环 并 发 地 被 执行 (显然 ， 短 的 那个 先 结束 ) 。 总 的 运行 时 间 为 
最 慢 的 那个 线程 的 运行 时 间 ， 而 不 是 所 有 的 线程 的 运行 时 间 之 和 。 


例 18.2 
$!/usr/bin/env python 


3 import thread 
4 from time import sleep, ctime 


6 def loop0(): 


7 print 'start loop 0 at:', ctime() 
8 sleep (4) 
9 print 'loop 0 done àat:', ctime() 


11 def loopl(): 
print 'start loop 1l at:', ctime() 
sleep (2) 


14 print 'loop 1 done at:', ctime() 


16 def main(): 


rint 'starting at:', ctime() 
P 1 


18 thread.start new thread(loopO, ()) 
19 thread.start new thread(loopl, ()) 
20 sleep(6) 

21 print 'all DONE at: ',ctime() 

$^ 

23 if name. "SA "y 

24 maint) 


Start_new_thread() 要 求 一 定 要 有 前 两 个 参数 。 所 以 ， 就 算 我 们 想 要 运行 的 函数 不 要 参数 ， 我 
们 也 要 传 一 个 空 的 元 组 。 


这 个 程序 的 输出 与 之 前 的 输出 大 不 相同 ， 之 前 是 运行 了 6~7 秒 ， 而 现在 则 是 4 秒 ， 是 最 长 的 循 
环 的 运行 时 间 与 其 他 的 代码 的 时 间 总 和 。 


$ mtsleepl.py 

starting at: Sun Aug 13 05:04:50 2006 
start loop 0 at: Sun Aug 13 05:04:50 2006 
start loop 1 at: Sun Aug 13 05:04:50 2006 
loop 1 done at: Sun Aug 13 05:04:52 2006 
loop 0 done at: Sun Aug 13 05:04:54 2006 
all DONE at: Sun Aug 13 05:04:56 2006 


睡眠 4 秒 和 2 秒 的 代码 现在 是 并 发 执行 的 。 这 样 ， 就 使 得 总 的 运行 时 间 被 缩短 了 。 可 以 看 到 ， 
loop1 甚 至 在 loop() 前 面 就 结束 了 。 程 序 的 一 大 不 同 之 处 就 是 多 了 一 个 "sleep (6) "的 函数 调 
用 。 为 什么 要 加 上 这 一 句 呢 ? 因为 如 果 我 们 没有 让 主线 程 停 下 来 ， 那 主线 程 就 会 运行 下 一 条 
语句 ， 显 示 “all done”， 然 后 就 关闭 运行 着 loop0() 和 loop1() 的 两 个 线程 ， 退 出 了 。 


我 们 没有 写 让 主线 程 停 下 来 等 所 有 子 线程 结束 之 后 再 继续 运行 的 代码 ， 这 就 是 我 们 之 前 说 线 
程 需 要 同步 的 原因 。 在 这 里 ， 我 们 使 用 了 sleep() 函 数 作为 我 们 的 同步 机 制 。 我 们 使 用 6 秒 是 因 
为 我 们 已 经 知道 ， 两 个 线程 (你 知道 ， 一 个 要 4 秒 ， 一 个 要 2 秒 ) 在 主线 程 等 待 6 秒 后 应 该 已 经 
结束 了 。 


你 也 许 在 想 ， 应 该 有 什么 好 的 管理 线程 的 方法 ， 而 不 是 在 主线 程 里 做 一 个 额外 的 延 时 6 秒 的 操 
作 。 因 为 这 样 一 来 ， 我 们 的 总 的 运行 时 间 并 不 比 单线 程 的 版 本 来 得 少 。 而 且 ， 像 这 样 使 用 
sleep() 函 数 做 线程 的 同步 操作 是 不 可 靠 的 。 如 果 我 们 的 循环 的 执行 时 间 不 能 事先 确定 的 话 ， 
那 怎么 办 呢 ? 这 可 能 造成 主线 程 过 早 或 过 晚 退出 。 这 就 是 锁 的 用 武之 地 了 。 


上 一 次 修改 程序 ， 我 们 去 掉 了 loop 函 数 ， 现 在 ， 我 们 要 再 一 次 修改 程序 为 例 18.3 的 
mtsleep2.py， 引 入 锁 的 概念 。 运 行 它 ， 我 们 看 到 ， 其 输出 与 mtsleepl.py 很 相似 ， 唯 一 的 区 别 
是 我 们 不 用 为 线程 什么 时 候 结 束 再 做 额外 的 等 待 。 使 用 了 锁 ， 我 们 就 可 以 在 两 个 线程 都 退出 
后 ， 马 上 退出 。 


$ mtsleep2.py 

starting at: Sun Aug 13 16:34:41 2006 
start loop 0 at: Sun Aug 13 16:34:41 2006 
start loop 1 at: Sun Aug 13 16:34:41 2006 
loop 1 done at: Sun Aug 13 16:34:43 2006 
loop 0 done at: Sun Aug 13 16:34:45 2006 
all DONE at: Sun Aug 13 16:34:45 2006 


我 们 是 怎么 通过 锁 来 完成 任务 的 呢 ? 先 看 一 看 代码 吧 。 
4118.3 使 用 线程 和 锁 (mtsleep2.py) 


这 里 ， 使 用 锁 比 mtsleepl.py 那 里 在 主线 程 中 使 用 Sleep() 函 数 更 合理 。 


Python 核心 编程 第 二 版 


1 £'/usr/bin/env python 
2 
3 import thread 
4 from time import sleep, ctime 
5 
é loops = [4,2] 
3 
8 def loop(nloop, nsec, lock): 
9 print 'start loop', nloop, 'at:', ctime() 
10 sleep (nsec) 
11 print 'loop', nloop, 'done at:', ctime() 
12 lock.release() 
13 
14 def main(): 
15 Print 'starting at:',ctime() 
16 locks * [] 
17 nloops = range (len(1loops)) 
18 
19 for i in nloops: 
20 lock * thread.allocate lock() 
21 lock.acquire() 
22 locks.append (lock) 
23 
24 for i in nloops: 
25 thread.start new thread(loop, 
26 (i, loops[i], locks[i])) 
27 
28 for i in nloops: 
29 while locks[ií].locked(): pass 
30 
31 print 'all DONE at;', ctisme() 
32 
33 if name 54 ' main ': 
34 main() 
逐 行 解 释 
1~ 6 行 


在 Unix 启 动 信息 行 后 面 ， 我 们 导入 了 thread 模 块 和 time 模 块 里 我 们 早已 熟悉 的 几 个 函数 。 
我 们 不 再 在 函数 里 写 死 要 等 4 秒 和 2 秒 ， 而 是 使 用 一 个 loop() 函 数 ， 把 这 些 常量 放 在 一 个 列 
表 Ioops 里 。 


8 ~ 12 行 


loop() 有 函数 替换 了 我 们 之 前 的 那 几 个 loop*() 函 数 。 在 loop() 函 数 里 ， 增 加 了 一 些 锁 的 操 
作 。 一 个 很 明显 的 改变 是 ， 我 们 现在 要 在 函数 中 记录 下 循环 的 号 码 和 要 睡眠 的 时 间 。 最 
后 一 个 不 一 样 的 地 方 就 是 那个 锁 了 。 每 个 线程 都 会 被 分 配 一 个 事先 已 经 获得 的 锁 ， 在 
sleep() 的 时 间 到 了 之 后 就 释放 相应 的 锁 以 通知 主线 程 ， 这 个 线程 已 经 结束 了 。 


14 ~ 34 行 
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3 3e 85 TE e 6,2 — ^M M&x main) hk P ZR » RT AA A thread.allocate lock() $ žre E 
一 个 锁 的 列表 ， 并 分 别 调用 各 个 锁 的 acquire() 函 数 获得 锁 。 获 得 锁 表 示 "“ 把 锁 锁 上 ”。 锁 上 后 ， 
我 们 就 把 锁 放 到 锁 列表 |locks 中 。 下 一 个 循环 创建 线程 ， 每 个 线程 都 用 各 自 的 循环 号 ， 睡 眠 时 
闻 和 锁 为 参数 去 调用 loop() 函 数 。 为 什么 我 们 不 在 创建 锁 的 循环 里 创建 线程 呢 ? 有 以 下 几 个 原 
A: (1) 我 们 想到 实现 线程 的 同步 ， 所 以 要 证 “所 有 的 马 同时 冲 出 栅栏 "。 (2) 获取 锁 要 花 一 
些 时 间 ， 如 果 你 的 线程 退出 得 “ 太 快 *， 可 能 会 导致 还 没有 获得 锁 ， 线 程 就 已 经 结束 了 的 情况 。 


在 线程 结束 的 时 候 ， 线 程 要 自己 去 做 解锁 操作 。 最 后 一 个 循环 只 是 坐 在 那 一 直 等 (达到 暂停 
主线 程 的 目的 ) ， 直 到 两 个 锁 都 被 解锁 为 止 才 继续 运行 。 由 于 我 们 顺序 检查 每 一 个 锁 ， 所 以 
我 们 可 能 会 要 长 时 间 地 等 待 运行 时 间 长 且 放 在 前 面 的 线程 ， 当 这 些 线程 的 锁 释 放 之 后 ， 后 面 
的 锁 可 能 早 就 释放 了 (表示 对 应 的 线程 已 经 运行 完了 ) 。 结 果 主 线程 只 能 毫 不 停歇 地 完成 对 
后 面 这 些 锁 的 检查 。 最 后 两 行 代码 的 意思 你 应 该 已 经 知道 了 ， 就 是 只 有 在 我 们 直接 运行 这 个 
脚本 时 ， 才 运行 main() 函 数 。 


在 核心 笔记 中 我 们 就 已 经 说 过 ， 使 用 thread 模 块 只 是 为 了 给 读者 演示 如 何 进 行 多 线程 编程 。 你 
的 多 线程 程序 应 该 使 用 更 高 级 别 的 模块 ， 如 threading 等 。 现 在 我 们 就 开始 讨论 它 。 


18.5 threading 模 块 


接 下 来 ， 我 们 要 介绍 的 是 更 高 级 别 的 threading 模 块 ， 它 不 仅 提 供 了 Thread 类 ， 还 提供 了 各 种 
非常 好 用 的 同步 机 制 。 表 18.2 列 出 了 threading 模 块 里 所 有 的 对 象 。 


在 这 一 节 中 ， 我 们 会 演示 如 何 使 用 Thread 类 来 实现 多 线程 。 之 前 已 经 介绍 过 锁 的 基本 概念 ， 
这 里 我 们 将 不 会 提 到 锁 原 语 。 而 Thread 类 也 有 某 种 同步 机 制 ， 所 以 ， 没 有 必要 详细 介绍 锁 原 


语 。 
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核心 提示 : 守护 线程 


另 一 个 避免 使 用 thread 模 块 的 原因 是 ， 它 不 支持 守护 线程 。 当 主线 程 退 出 时 ， 所 有 的 子 线程 不 
论 它们 是 否 还 在 工作 ， 都 会 被 强行 退出 。 有 时 我 们 并 不 期 望 这 种 行为 ， 这 时 就 引入 了 守护 线 
程 的 概念 。 


Threading 模 块 支持 守护 线程 ， 它 们 是 这 样 工作 的 : 守护 线程 一 般 是 一 个 等 待 客 户 请 求 服 务 
器 ， 如 果 没 有 客户 提出 请 求 ， 它 就 在 那 等 着 。 如 果 你 设 定 一 个 线程 为 守护 线程 ， 就 表示 你 在 
说 这 个 线程 是 不 重要 的 ， 在 进程 退出 的 时 候 ， 不 用 等 待 这 个 线程 退出 。 就 像 你 在 第 16 章 网 络 
编程 看 到 的 ， 服 务 器 线程 运行 在 一 个 无 限 循 环 中 ， 一 般 不 会 退出 。 


如 果 你 的 主线 程 要 退出 的 时 候 ， 不 用 等 待 那些 子 线程 完成 ， 那 就 设 定 这 些 线程 的 daemon 属 
性 。 即 ， 在 线程 开始 (调用 thread.start()) 之 前 ， 调 用 setDaemon() 有 函数 设 定 线程 的 daemon 
标志 (thread.setDaemon (True) ) 就 表示 这 个 线程 “不 重要 ”。 


如 果 你 想 要 等 待 子 线程 完成 再 退出 ， 那 就 什么 都 不 用 做 ， 或 者 显 式 地 调用 
thread.setDaemon (False) 以 保证 其 daemon 标 志 为 False。 你 可 以 调用 thread.isDaemon() 
函数 来 判断 其 daemon 标 志 的 值 。 新 的 子 线程 会 继承 其 父 线程 的 daemon 标 志 。 整 个 Python 会 
在 所 有 的 非 守护 线程 退出 后 才 会 结束 ， 即 进程 中 没有 非 守 护 线程 存在 的 时 候 才 结束 。 


18.5.4 Thread 类 


threading 的 Thread 类 是 你 主要 的 运行 对 象 。 它 有 很 多 thread 模 块 里 没有 的 函数 ， 详 见 表 
18.3 ° 


用 Thread 类 ， 你 可 以 用 多 种 方法 来 创建 线程 。 我 们 在 这 里 介绍 三 种 比较 相像 的 方法 。 你 可 以 
任 选 一 种 你 喜欢 的 ， 或 最 适合 你 的 程序 以 及 最 能 满足 程序 可 扩展 性 的 (我 们 一 般 比 较 喜 欢 最 
后 一 个 选择 ) 


e 创建 一 个 Thread 的 实例 ， 传 给 它 一 个 函数 ; 
e 创建 一 个 Thread 的 实例 ， 传 给 它 一 个 可 调用 的 类 对 象 ; 


e 从 Thread 派 生出 一 个 子 类 ， 创 建 一 个 这 个 子 类 的 实例 。 
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jom( limcow— None) T Py mig. f BHRFHMDOE, inv T timeout; J | 最 prp ncn " TL 
4 
getName() B pm NO H Y 
seiNamel name ) | QNM PM EM 
isAlive() z | 布尔 标志 ， 表 示 这 个 线程 是 砍 还 在 运行 中 
~ isDaemomM) | 返回 线程 的 dsempon 标 者 —((— 
+ 
setDaemon(daemonic) IE HF) daemon REU daemonic 《一 定 要 在 调用 stan) fg UE ED 


创建 一 个 Thread 的 实例 ， 传 给 它 一 个 函数 。 


第 一 个 例子 中 ， 我 们 将 初始 化 一 个 Thread 对 象 ， 把 函数 (及 其 参数 ) 像 上 一 个 例子 那样 传 进 
去 。 在 线程 开始 执行 的 时 候 ， 这 个 函数 会 被 执行 。 把 mtsleep2.py 脚 本 拿 过 来 ， 一 些 调整 加 入 
Thread 对 象 的 使 用 ， 就 成 了 例 18.4 中 的 mtsleep3.py。 

运行 的 输出 跟 之 前 很 相似 : 


$ mtsleep3.py 
starting at: Sun Aug 13 18:16:38 2006 


start loop 0 at: Sun Aug 13 18:16:38 2006 


start loop 1 at: Sun Aug 13 18:16:38 2006 

loop 1 done at: Sun Aug 13 18:16:40 2006 

loop 0 done at: Sun Aug 13 18:16:42 2006 

all DONE at: Sun Aug 13 18:16:42 2006 
那么 ， 都 做 了 些 什么 修改 呢 ? 在 使 用 thread 模 块 时 使 用 的 锁 没 有 了 ， 新 加 了 一 些 Thread 对 
象 。 在 实例 化 每 个 Thread 对 象 的 时 候 ， 我 们 把 函数 (target) 和 参数 (args) 传 进去 ， 得 到 返 
回 的 Thread 实 例 。 实 例 化 一 个 Thread (调用 Thread()) 与 调用 thread.start_new _ thread() 之 
间 最 大 的 区 别 就 是 ， 新 的 线程 不 会 立即 开始 。 在 你 创建 线程 对 象 ， 但 不 想 马上 开始 运行 线程 
的 时 候 ， 这 是 一 个 很 有 用 的 同步 特性 。 


例 18.4 ”使 用 threading 模 块 (mtsleep3.py) 
threading 模 块 的 Thread 类 有 一 个 join() 驾 数 ， 允 许 主线 程 等 待 线程 的 结 


1 t! /usrz/bin/env python 


import threading 
from time import sleep, ctime 


6 loops e (4, i 


8 def ioop(nloop, nsec): 


9 print 'start loop', nloop, 'at:', ctime() 
10 sleep (nsec) 

11 print 'loop', nloop, 'done at:', ctime() 
12 


13 def main(): 


14 print 'starting at:', ctime() 

15 threads * [] 

16 nloops = range(len(1loops)) 

17 

18 for i in nloops: 

19 t*threading.Thread(target*loop, 
20 args*"(i,loops[i])) 

21 threads.append (t) 

22 

3 for i in nloops & star hre 
^ ireads[ start () 
26 for i in nloops: & wait for all 
21 nrea n() & threads t i 
28 
29 print 'all DONE at:', ctime(t) 

30 

l if nam -= main 

32 main() 


所 有 的 线程 都 创 建 了 之 后 , T — 3e 18 Jf] start() hÈ Ay 而 不 是 创建 一 个 启 EA SB P. 
用 再 管理 一 堆 锁 ( 分 配 锁 、 获得 锁 、 释 放 锁 、 检查 锁 的 状态 等 ) " 只 要 简单 地 对 每 个 线程 调 
Ajoin) HARTAT ° 


join() 会 等 到 线程 结束 ， 或 者 在 给 了 timeout 参 数 的 时 候 ， 等 到 超时 为 止 。 使 用 join() 看 上 去 会 比 
使 用 一 个 等 待 锁 释 放 的 无 限 循环 清楚 一 些 (这 种 锁 也 被 称 为 “ 自 旋 锁 ”") o 


join() 的 另 一 个 比较 重要 的 方面 是 它 可 以 完全 不 用 调用 。 一 旦 线程 启动 后 ， 就 会 一 直 运 行 ， 直 
到 线程 的 函数 结束 ， 退 出 为 止 。 如 果 你 的 主线 程 除 了 等 线程 结束 外 ， 还 有 其 他 的 事情 要 做 
(如 处 理 或 等 待 其 他 的 客户 请 求 ) ， 那 就 不 用 调用 join()， 只 有 在 你 要 等 待 线程 结束 的 时 候 才 
要 调用 join() ° 


创建 一 个 Thread 的 实例 ， 传 给 它 一 个 可 调用 的 类 对 象 。 


与 传 一 个 函数 很 相似 的 另 一 个 方法 是 在 创建 线程 的 时 候 ， 传 一 个 可 调用 的 类 的 实例 供 线程 局 
动 的 时 候 执 行 一 一 这 是 多 线程 编程 的 一 个 更 为 面向 对 象 的 方法 。 相 对 于 一 个 或 几 个 函数 来 
说 ， 由 于 类 对 象 里 可 以 使 用 类 的 强大 的 功能 ， 可 以 保存 更 多 的 信息 ， 这 种 方法 更 为 灵活 。 


把 ThreadFunc 类 加 入 到 mtsleep3.py 代 码 中 ， 并 做 一 些 其 他 的 小 修改 后 ， 就 得 到 了 例 18.5 中 的 
mtsleep4.py ° 运行 它 ， 就 会 得 到 如 下 的 输出 : 


$ mtsleep4.py 

starting at: Sun Aug 13 18:49:17 2006 
start loop O at: Sun Aug 13 18:49:17 2006 
start loop 1 at: Sun Aug 13 18:49:17 2006 
loop 1 done at: Sun Aug 13 18:49:19 2006 
loop 0 done at: Sun Aug 13 18:49:21 2006 
all DONE at: Sun Aug 13 18:49:21 2006 


那么 ， 这 次 又 改 了 些 什么 呢 ? 主要 是 增加 了 ThreadFunc 类 和 创建 Thread 对 象 时 会 实例 化 一 个 
可 调用 类 ThreadFunc 的 类 对 象 。 也 就 是 说 ， 我 们 实例 化 了 两 个 对 象 。 下 面 ， 来 仔细 地 看 一 看 
ThreadFunc 类 吧 。 

我 们 想 让 这 个 类 在 调用 什么 函数 方面 尽量 地 通用 ， 并 不 局 限于 那个 loop() 驾 数 。 所 以 ， 我 们 加 
了 一 些 修改 ， 如 ， 这 个 类 保存 了 函数 的 参数 ， 函 数 本 身 以 及 函数 的 名 字 字符 囊 。 构 造 器 init() 

里 做 了 这 些 值 的 赋值 工作 。 

创建 新 线程 的 时 候 ，Thread 对 象 会 调用 我 们 的 ThreadFunc 对 象 ， 这 时 会 用 到 一 个 特殊 辣 

数 call()。 由 于 我 们 已 经 有 了 要 用 的 参数 ， 所 以 就 不 用 再 传 到 Thread() 的 构造 器 中 。 由 于 我 们 

有 一 个 参数 的 元 组 ， 这 时 要 在 代码 中 使 用 apply() 辑 数 。 如 果 你 使 用 的 是 Pythonl.6 或 是 更 高 版 
本 ， 你 可 以 使 用 11.6.3 节 中 所 说 的 新 的 调用 语法 ， 而 不 用 像 第 16 行 那样 使 用 apply() 部 数 : 


self.res = self.func(*self.args) 


此 例 中 ， 我 们 传 了 一 个 可 调用 的 类 (的 实例 ) ， 而 不 是 仅 传 一 个 函数 。 相 对 mtsleep3.py 中 的 
方法 来 说 ， 这 样 做 更 具 面 向 对 象 的 概念 。 


例 18.5 
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1 #!/usr/bin/env python 
2 
3 import threading 
á from time import sleep, ctime 
5 
6 loops = [4,2] 
- 
8 class ThreadFunc (object): 
9 
10 def _ init (self, func, args, namew-''): 
11 self.namesename 
12 self.func-func 
13 self.args-args 
14 
15 def — call. (self): 
16 apply(self.func, self.args) 
17 
18 def loop(nloop, nsec}: 
19 print 'start loop', nloop, 'at:', ctime() 
20 sleep (nsec) 
21 print 'loop', nloop, 'done at:', ctime() 
22 
23 def main(): 
24 print 'starting at:', ctime() 
25 threads = [] 
26 nloops = range (len(loops)) 
27 
28 for i in nloops: # create all threads 
29 t = threading.Thread( 
30 targetsThreadFunc (loop, ti,loops[i]), 
31 loop. . name. )) 
32 threads.append(t) 
33 
34 for i in nloops: 8 start all threads 
35 threads[i].start() 
36 
37 for i in nloops: $ wait for completion 
38 threads[i].join() 
39 
40 print 'all DONE at:', ctime() 
41 
42 if  /name  -- ' main ': 
43 main() 


从 Thread 派 生出 一 个 子 类 ， 创 建 一 个 这 个 子 类 的 实例 。 


最 后 一 个 例子 介绍 如 何 子 类 化 Thread 类 ， 这 与 上 一 个 例子 中 的 创建 一 个 可 调用 的 类 非常 像 。 
使 用 子 类 化 创建 线程 (第 29~30 行 ) 使 代码 看 上 去 更 清晰 明了 “。 我 们 将 在 例 18.6 中 给 出 
mtsleep5.py 的 代码 ， 以 及 代码 运行 的 输出 。 比 较 mtsleep5.py 和 mtsleep4.py 的 任务 则 留 给 读 
者 作为 练习 。 
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3 


T A mtsleep5.py ^ $a H » FEE * RRIAZ- R : 


$ mtsleep5.py 

starting at: Sun Aug 13 19:14:26 2006 
start loop 0 at: Sun Aug 13 19:14:26 2006 
start loop 1 at: Sun Aug 13 19:14:26 2006 
loop 1 done at: Sun Aug 13 19:14:28 2006 
loop 0 done at: Sun Aug 13 19:14:30 2006 
all DONE at: Sun Aug 13 19:14:30 2006 


在 读者 比较 mtsleep4 和 mtsleep5 两 个 模块 的 代码 之 前 ， 我 们 想 指 出 最 重要 的 两 点 改变 : 


(1) 我 们 的 MyThread 子 类 的 构造 器 一 定 要 先 调用 基 类 的 构造 器 (第 9 行 ) ; (2) 之 前 的 特 
殊 函 数 call() 在 子 类 中 ， 名 字 要 改 为 run()。 


现在 ， 在 MyThread 类 中 ， 加 入 一 些 用 于 调试 的 输出 信息 ， 把 代码 保存 到 myThread 模 块 中 

( 见 例 18.7) ， 并 在 下 面 的 例子 中 导入 这 个 类 。 除 了 简单 地 使 用 apply() 函 数 来 运行 这 些 函 数 
之 外 ， 我 们 还 把 结果 保存 到 实现 的 self.res 属 性 中 ， 并 创建 一 个 新 的 函数 getResult() 来 得 到 结 
果 o 


18.5.2 SCR ` MRF Ae 


1418.8 F fy mtfacfib.py Pr A r6 T RERIK ` MRF A hfe RAAT o BR ode A R 
程 中 运行 这 三 个 函数 ， 然 后 在 多 线程 中 做 同样 的 事 ， 以 说 明 多 线程 的 好 处 。 


我 们 现在 要 子 类 化 Thread 类 ， 而 不 是 创建 它 的 实例 。 这 样 做 可 以 更 灵活 地 定制 我 们 的 线程 对 
象 ， 而 且 在 创建 线程 的 时 候 也 更 简单 。 


例 18.6 
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1 $'!/usr/bin/env python 

2 

3 import threading 

4 from time import sleep, ctime 

5 

6 loops = (4, 2) 

7 

8 class MyThread(threading.Thread): 

9 def init (self, func, args, name-''): 
10 threading.Thread. init, (self) 
11 self.name*name 

12 self.funce*func 

13 self.argse"-args 

14 

15 def run(self): 

16 apply(self.func, self.args) 

17 

18 def loop(nloop, nsec): 

19 print 'start loop', nloop, 'at:', ctime() 
20 sleepí(nsec) 

21 print 'loop', nloop, 'done at:', ctime() 
22 

23 def main(): 

24 print 'starting at:', ctime() 
25 threads = [] 

26 nloops = range(len(loops)) 

27 

28 for i in nloops: 

29 t = MyThread(loop, (i, loops[i]), 
30 loop. name ) 

31 threads.append(t) 

32 

33 for i in nloops: 

34 threads[il.start() 

35 

36 for i in nloops: 

37 threads[i].join() 

38 

39 print 'all DONE at:', ctime()' 

40 

41 if  , name  Á-- ' main ': 

42 main() 


4118.7  MyThread-f- X46 Thread (myThread.py) 


为 了 让 mtsleep5.py 中 ，Thread 的 子 类 更 为 通用 ， 我 们 把 子 类 单独 放 在 一 个 模块 中 ， 并 加 上 一 
^*getResult() $ žr Jt] YA 3& E 9 Zi 65 35 41 25 7. o 
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$!/usr/bin/env python 


import threading 
4 from time import ctime 


6 class MyThread(threading.Thread): 


7 def 3 init (self, func, args, name»*''): 


B threading.Thread. init (self) 

9 self.name»name 

10 self.func-func 

11 self.args-args 

12 

13 def getResult(self): 

14 return self.res 

15 

16 def run(self): 

17 print 'starting', self.name, 'at:', \ 
18 ctíme() 

19 self.res = apply(self.func, self.args) 
20 print self.name, 'finished at:', ^ 

21 ctime() 


在 单线 程 中 运行 只 要 简单 地 逐个 调用 这 些 函 数 ， 在 函数 结束 后 显示 对 应 的 结果 。 在 多 线程 
E Al et sq pid 时 适应 有 输出 和 没 
输出 的 函数 ) ， 我 们 会 等 到 要 结束 时 才 会 调用 getResult() 辑 数 ， 并 在 最 后 显示 每 个 函数 的 结 
果 。 

由 于 这 些 函 数 运行 得 很 快 ( 斐 波 那 契 函 数 会 慢 一 些 ) ， 你 会 看 到 ， 我 们 得 在 每 个 函数 中 加 上 
BRE d: ， 让 兄 数 慢 下 来 ， 以 便于 我 们 能 方便 地 看 到 多 线程 能 在 多 大 程度 上 加 速 程序 
的 运行 。 不 过 实际 工作 中 ， 你 一 般 不 会 想 在 程序 中 加 上 sleep() 函 数 的 。 下 面 是 程序 的 输出 : 


$ mtfacfib.py 

*** SINGLE THREAD 

starting fib at: Sun Jun 18 19:52:20 2006 
233 

fib finished at: Sun Jun 18 19:52:24 2006 


在 这 个 多 线程 程序 中 ， 我 们 会 分 别 在 单线 程 和 多 线程 环境 中 ， 运 行 三 个 递归 函数 。 


例 18.8 


o ^ 
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#!/usr/bin/env python 


from myThread import MyThread 
from time import ctime, sleep 


def fib(x): 
sleep(0.005) 
if x « 2: return 1 
return (fib(x-2) * fib(x-1)) 


O OO -) 0 Ut! 4 (t hàN | 
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o 5% 
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10 

11 def facíx): 

12 sleep(0.1) 

13 if x«2: retuen 1 

14 return (x * fac(x-1)) 
15 

16 def sum(x): 

17 sleep(0.1) 

18 if x«2: retuen 1 

19 return (x *5sum(x-1)) 
20 


21 funcs = [fib, fac, sum] 
22 n= 12 


24 def nain(): 


25 nfuncs = range(len(funcs)]) 

26 

27 print '*** SINGLE THREAD' 

28 for i in nfuncs: 

29 print 'starting', funcs[i]. name , 'at:', \ 
30 ctime() 

31 print funcs[i] (n) 

32 print funcs[i]. name , 'finished at:', \ 
33 etime() 

34 

35 print 'in*** MULTIPLE THREADS" 
36 threads = [] 

37 for i in nfuncs: 

38 t*MyThread(funcs[i], (n,), 

39 funcs[i]. name ) 

40 threads. append (t) 

41 

42 for i in nfuncs: 

43 threads[i].start() 

44 

45 for i in nfuncs: 

46 threads [t].30in() 

47 print threads[i].getResult() 
48 

49 print 'all DONE' 

50 

51 if name (9 ' gain ': 


52 main() 


starting fac at: Sun Jun 18 19:52:24 2006 


479001600 


fac finished at: Sun Jun 18 19:52:26 2006 
starting sum at: Sun Jun 18 19:52:26 2006 


78 


sum finished at: Sun Jun 18 19:52:27 2006 


*** MULTIPLE THREADS 





starting fib at: Sun 
starting fac at: Sun 
starting sum at: Sun 
fac finished at: Sun 
sum finished at: Sun 
fib finished at: Sun 
233 

479001600 

78 

all DONE 
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Jun 
Jun 
Jun 
Jun 
Jun 
Jun 


18 
18 
18 
18 
18 
18 


19:52:27 
19:52:27 
19:52:27 
19:52:28 
19:52:28 
19:52:31 


2006 
2006 
2006 
2006 
2006 
2006 
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18.5.3 threading 模 块 中 的 其 他 函数 


除了 各 种 同步 对 象 和 线程 对 象 外 ，threading 模 块 还 提供 了 一 些 函 数 。 见 表 18.4 。 





RR 184 threading 模块 的 函数 
函 数 LI 述 
activeCount() 当 章 话 动 的 线程 对 象 的 数量 
current Thread() 返回 当前 钱 程 对 象 
enumerate() ik [9] ^ EE RS LI (UE 
settrace(func)" 为 所 有 线程 设置 一 个 跟 中 函数 
setprofile(func j* A BHCCPES E profile 函数 


a — Python23 新 增 


18.5.4 生产 者 -消费 者 问题 和 Queue 模 块 


最 后 一 个 例子 演示 了 生产 者 和 消费 者 的 场景 。 生 产 者 生产 货物 ， 然 后 把 货物 放 到 一 个 队列 之 
类 的 数据 结构 中 ， 生 产 货 物 所 要 花费 的 时 间 无 法 预先 确定 。 消 费 者 消耗 生产 者 生产 的 货物 的 
时 间 也 是 不 确定 的 。 

Queue 模 块 可 以 用 来 进行 线程 间 通 讯 ， 让 各 个 线程 之 间 共 享 数 据 。 现 在 ， 我 们 创建 一 个 队 
列 ， 让 生产 者 (线程 ) 把 新 生产 的 货物 放 进 去 供 消 费 者 (线程 ) 使 用 。 要 达到 这 个 目的 ， 我 
们 要 使 用 到 Queue 模 块 的 以 下 属性 ( 见 表 18.5) 。 











X 18.5 URSUS GE 
函 s E 述 
Queue 模块 函数 
qucue( size) | en 个 大 小 为 size 的 Queue 对 象 
Queue HRAN 
返回 队列 的 大 小 《由 于 在 返回 的 时 候 ， 队 列 可 能 会 被 其 他 线程 
w— Mi. ELI RNO 
empty() WRUHA TEE True, HANEP False 
full) fn EAAELCUAGR EE] True, FALE False 
pattiom, Hoch) E ien 区 到 队列 中 ， 如 果 给 了 bock CFA O . MIRI 
se blocke0) et (不 为 0) ， 函 数 会 一 真 


很 容易 地 ， 我 们 就 能 写 出 例 18.9 的 prodcons.py 的 代码 。 


下 面 是 这 个 脚本 的 运行 输出 : 
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du object z ~ 
sta q rader u un < 
med object z -~ 
I i J object s w 
T bject m Q. e w 
E obje« Q Ww 
Ẹ i bje« Q W 
ing obje ro W 
15 i objec 5m Q Li 
isumed ob m Q. ze ~ 
writer is T, 18 
r b ( 
id nis a Su f 


如 你 所 见 ， 生 产 者 和 消费 者 不 一 定 是 轮流 执行 的 (多 亏 有 了 随机 数 ) o ERE’ ELTE 
是 充满 了 随机 性 和 不 确定 性 。 


逐 行 解释 
1~6 行 


在 这 个 模块 中 ， 我 们 要 使 用 Queue.Queue 对 象 和 我 们 在 例 18.7 中 给 出 的 线程 类 myThread. 
MyThread。 我 们 将 使 用 random.randint() 函 数 来 随机 进行 生产 和 消耗 ， 并 从 time 模 块 中 导入 常 
用 的 属性 。 


8 ~ 16 行 


writeQ() 和 readQ() 函 数 分 别 用 来 把 对 象 放 入 队列 和 消耗 队列 中 的 一 个 对 象 。 在 这 里 我 们 使 用 
字符 串 'XXX' 来 表示 队列 中 的 对 象 。 


18 ~ 26 行 


writer() 函 数 只 做 一 件 事 ， 就 是 一 次 往 队列 中 放 入 一 个 对 象 ， 等 待 一 会 儿 ， 然 后 再 做 指定 次 数 
的 同样 的 事 ， 这 个 次 数 是 由 脚本 运行 时 随机 生成 的 。reader() 函 数 做 的 事 比较 类 似 ， 只 是 它 是 
用 来 消耗 对 象 的 。 


你 会 注意 到 ，WwWriter 睡 眠 的 时 间 一 般 会 比 reader 睡 眠 的 时 间 短 。 这 可 以 减少 reader 党 试 从 空 队 
列 中 取 数 据 的 机 会 。writer 的 睡眠 时 间 短 ， 那 reader 在 想 要 数据 的 时 候 总 是 能 拿 到 数据 。 


28 ~ 29 行 
设置 有 多 少 个 线程 要 被 运行 。 
例 18.9 ”生产 者 -消费 者 问题 (prodcons.py) 


这 个 实现 中 使 用 了 Queue 对 象 和 随机 地 生产 〈 和 消耗 ) 货物 的 方式 。 生 产 者 和 消费 者 相互 独 
立 并 且 并 发 地 运行 。 
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&!/usr/bin/env python 


from random import randint 
from time import sleep 

from Queue import Queue 

from myThread import MyThread 


J dy Q: e t) Ww HP 


8 def wriíiteQ(queue): 


9 print 'producing object for Q...', 
10 queue.put('xxx', 1) 

11 print "size now", queue.qsize() 

12 

13 def readQ(queue) : 

14 val * queue.get (1) 

15 print 'consumed object from Q... size now', V 
16 queue.qsize() 

17 

18 def writer(queue, loops): 

19 for i in range (loops): 

20 writeQ(queue) 

21 sleep(randint(1, 3)) 

22 

23 def reader(queue, loops): 

24 for i in range(1loops): 

25 reado (queue) 

26 sleep(randint(2, 5)) 

27 


28 funcs = [writer, reader] 
29 nfuncs = range (len(funcs)) 


30 
31 def main(): 
32 nloops * randint(2, 5) 
33 q * Queue (32) 
34 
35 threads = [] 
36 for i in nfuncs: 
37 t * MyThread(funcs[i], (q, nloops), 
38 funcs[i].. name, ) 
39 threads.append(t) 
40 
41 for i in nfuncs: 
42 threads[i].start() 
43 
44 for 1 in nfuncs: 
45 threads[i].joín() 
46 
417 print 'all DONE' 
48 
49 if name == ' main, ': 
50 main() 

31 ~ 47 行 
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最 后 ， 就 到 了 main() 函 数 ， 它 与 之 前 的 所 有 脚本 的 main() 函 数 都 很 像 。 先 是 创建 所 有 的 线程 ， 
然后 运行 它们 ， 最 后 ， 等 两 个 线程 都 结束 后 ， 得 到 最 后 的 运行 结果 。 


从 本 例 中 ， 我 们 可 以 了 解 到 ， 一 个 要 完成 多 项 任务 的 程序 ， 可 以 考虑 每 个 任务 使 用 一 个 线 
程 。 这 样 的 程序 在 设计 上 相对 于 单线 程 做 所 有 事 的 程序 来 说 ， 更 为 清晰 明了 。 


本 章 中 ， 我 们 看 到 了 单线 程 的 程序 在 程序 性 能 上 的 限制 。 尤 其 在 有 相互 独立 的 ， 运 行 时 间 不 
确定 的 多 个 任务 的 程序 里 ， 把 多 个 任务 分 隔 成 多 个 线程 同时 运行 会 比 顺序 运行 速度 更 快 。 由 
于 Python 解释 器 是 单线 程 的 ， 所 以 不 是 所 有 的 程序 都 能 从 多 线程 中 得 到 好 处 。 不 过 ， 你 已 经 
对 Python 下 的 多 线程 有 所 了 解 ， 在 适当 的 时 候 ， 可 以 利用 它 来 改善 程序 的 性 能 。 


18.6 相关 模块 


下 表 列 出 了 一 些 多 线程 编程 中 可 能 用 得 到 的 模块 : 


表 18.6 





D ti i 


thread Mk. EOE P 


thrcading not iom PP A mIpMS 
- 一 
Queuc oc £i N HESS LOUP CIR AG. CFIFOD UL 
mutex Heus 
+ 
SocketServer HARRODS TCP 和 UDP RAZ 








18.7 练习 
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18-1. 进 程 与 线程 。 线 程 与 进程 的 区 别 是 什么 


18-2.Python 的 线程 。 在 Python 中 ， 哪 一 种 多 线程 的 程序 表现 得 更 好 ，1/O 〇 密集 型 的 还 是 
计 和 工 密 集 型 的 ? 


18-3. 线 程 。 你 认为 多 CPU 的 系统 与 一 般 的 系统 有 什么 大 的 不 同 ? 多 线程 的 程序 在 这 种 系 
统 上 的 表现 会 怎么 样 ? 


18-4. 线 程 和 文件 。 把 练习 9-19 的 答案 做 一 些 改 进 。 我 们 要 得 到 一 个 字 节 值 ， 一 个 文件 
名 ， 然 后 显示 在 文件 中 那个 字 节 出 现 了 多 少 次 。 假 设 这 个 文件 非常 大 。 文 件 是 可 以 有 多 
个 读者 的 ， 那 我 们 就 可 以 创建 多 个 线程 ， 每 个 线程 负责 文件 的 一 部 分 。 最 后， 把 所 有 的 
线程 的 结果 相 加 。 使 用 timeit() 对 单线 程 和 多 线程 分 别 进行 计时 ， 对 性 能 的 改进 进行 讨 
ie e 

18-5. 线 程 ， 文 件 和 正则 表达 式 。 你 有 一 个 非常 大 的 mailbox 文 件 一 一 如 果 没 有 的 话 ， 你 可 
以 把 你 所 有 的 电子 邮件 的 原始 信息 放 到 一 个 文本 文件 中 。 你 现在 要 做 的 是 ， 使 用 在 15 章 
写 的 识别 电子 邮件 地 址 和 网 页 URL 的 正则 表达 式 ， 分 析出 这 个 大 文件 里 的 所 有 的 电子 邮 
件 地 址 和 URL， 把 这 些 链接 写 到 一 个 .html (或 .htm) 文件 中 。 在 这 个 文件 生成 时 ， 会 自 
动 显示 一 个 浏览 器 ， 打 开 这 个 文件 ， Poe 使 用 多 线程 来 分 隔 处 理 大 文件 和 
把 结果 写 到 一 个 新 的 .html 文 件 的 操作 。 在 浏览 器 中 测试 一 下 你 的 结果 ， 确 保 那些 链接 都 
能 正常 工作 。 


18-6. 线 程 和 网 络 。 你 在 之 前 做 的 聊天 服务 器 程序 (练习 16-7 到 16-10) 也 许 会 用 到 重量 
级 线程 或 者 说 进程 ， 把 那个 代码 改 成 多 线程 的 。 


18-7.* 线 程 和 和 Web 编程。 练习 19.1 中 的 候 虫 ， 是 一 个 单线 程 的 网 页 下 载 程序 ， 但 可 以 利用 
多 线程 提高 性 能 。 修 改 crawl.py (你 可 以 叫 它 mtcrawl.py) ， 让 它 可 以 使 用 多 个 不 相关 的 
线程 来 下 载 网 页 。 注 意 要 使 用 某 种 锁 的 机 制 以 确保 不 会 在 访问 链接 队列 的 时 候 出 现 访问 


冲突 。 

18-8. 线 程 池 。 修 改 例 18.9 的 代码 ， 不 再 是 一 个 生产 者 和 一 个 消费 者 ， 而 是 可 以 有 任意 个 
消费 者 线程 (一 个 线程 池 ) ， 每 个 线程 可 以 在 任意 时 刻 处 理 或 消耗 任意 多 个 产品 。 
s ul ae eet 。 你 可 以 选 
择 要 使 用 多 少 个 线程 。 比 较 单 线程 与 多 线程 的 性 能 差异 。 提 示 : 回顾 一 下 第 9 章 (文件 和 
lO) 的 练习 e 


18-10. 把 你 之 前 的 解决 方案 应 用 到 你 选择 的 几 个 任务 中 ， 如 ， 处 理 一 些 电子 邮件 ， 下 载 
一 些 网 页 ， 处 理 一 些 RSS 和 Atom feeds， 聊 天 时 的 消息 处 理 ， 解 一 个 迹 题 等 。 
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第 19 章 ”图形 用 户 界 编程 


本 章 主题 


guy 


4 5l 
+ Tkinter 与 Python 编程 

+ Tkinter 模 块 

e Tk 组 件 库 

+ Tkinter 使 用 举例 

e 标签 、 按 钮 与 进度 条 组 件 

4 一 个 使 用 Tk 的 中 级 范例 

+ 其 他 GUI 简介 (Tix、Pmw、wxPython 和 PyGTK) 
e 相关 模块 和 其 他 GUI 


本 章 我 们 将 对 图 形 用 户 界 面 (graphical user interface, GUI) 编程 进行 简介 。 不 jio s 
及 该 领域 还 是 想 学 到 更 多 ， 抑 或 只 是 想 看 看 Python 是 如 何 做 的 ， 这 一 章 都 会 适合 你 。 在 这 

短 的 一 章 里 我 们 无 法 对 GUI 程序 开发 介绍 得 面面俱到 ， 但 我 们 将 讲解 最 核心 ani o ia 
默认 GUI 工具 集 是 TKk， 它 也 是 我 们 将 使 用 的 最 基本 的 GUI 工具 集 ， 我 们 可 以 通过 Python 接口 
Tkinter 来 使 用 Tk (Tkinter 正 是 “Tk 接 口 "之 意 ) 。 


Tk 并 非 " 最 强 、 最 新 ”， 也 不 是 包含 GUI 构建 模块 最 多 的 工具 集 ， 但 它 非 常 简单 ， 并 且 可 以 开发 
出 能 运行 于 大 多 数 平台 的 GUI 程序 。 我 们 将 用 Tkinter 举 几 个 例子 其 中 包括 一 个 中 级 范例 ， 随 后 
我 们 还 将 给 出 几 个 其 他 工具 集 的 例子 。 一 旦 完成 了 本 章 的 学 习 ， 你 将 掌握 构建 复杂 应 用 程序 
的 技巧 ， 也 有 能 力 转向 那些 更 流行 的 图 形 工具 集 。Python 有 许多 对 主流 工具 集 的 绑 定 
(Binding) 或 转 接 (Adaptor) ， 其 中 不 乏 对 商业 系统 的 ， 这 里 就 不 多 介绍 了 。 


19.1 简介 


19.1.4 什么 是 Tcl、Tk 和 和 Tkinter 


Tkinter 是 Python 的 默认 GUI 库 ， 它 基于 Tk 工具 集 ， 后 者 最 初 是 为 工具 命令 语言 (Tcl) 设计 
的 。Tk 流 行 后 被 移植 到 许多 其 他 脚本 语言 中 ， 和 包括 Perl (Perl/Tk) ^» Ruby (Ruby/Tk) 和 
Python (Tkinter) 。 借 助 于 Tk 开发 GUI 的 可 移植 性 和 灵活 性 ， 加 上 脚本 语言 的 简洁 和 系统 语 
言 的 强劲 ， 我 们 得 到 了 一 件 可 与 商业 软件 相 匹 敌 的 利器 ， 它 可 以 用 于 快速 开发 各 种 GUI 程 序 。 


如 果 是 初 涉 GUI 编 程 ， 你 会 惊喜 地 发 现 一 切 竞 如 此 简单 。 你 也 会 发 现 Python 搭 配 Tkinter 提 供 
了 一 种 高 效 的、 激动 人 心 的 应 用 程序 构建 方式 ， 可 以 用 来 开发 出 有 趣 (并 且 往 往 还 有 用 ) 的 
程序 。 而 同样 的 程序 如 果 直 接 使 用 C/C++， 基 于 本 地 窗口 系统 库 开 发 ， 将 多 花 很 长 的 时 间 。 一 
旦 设计 好 了 程序 及 相应 外 观 ， 接 下 来 要 做 的 只 是 用 那些 被 称 作 组 件 的 基本 构造 块 去 搭建 想 要 
的 模块 ， 最 终 再 赋予 其 功能 就 能 让 一 切 “ 活 起 来 ”。 


如 果 你 是 个 Tk 老手 ， 不 论 是 使 用 过 Tcl 还 是 Perl， 都 会 发 现 Python 提 供 了 一 种 进行 GUI 编 程 的 
全 新 方式 。Python 基 于 Tk 提供 了 一 种 更 高 效 的 快速 原型 系统 用 以 创建 应 用 。 别 忘 了 你 同时 还 
享有 Python 的 系统 访问 、 网 络 操作 、XML、 数 字 可 视 化 、 数 据 库 访问 、 以 及 所 有 其 他 标准 库 
和 第 三 方 模块 。 


一 旦 你 在 自己 的 系统 中 装 好 了 Tkinter， 用 不 了 15 分 钟 就 可 以 让 你 的 第 一 个 GUI 程 序 运 行 起 
| 


19.1.2 ”安装 和 使 用 Tkinter 


类 似 于 线程 模块 ， 你 系统 中 的 Tkinter 未 必 是 上 默认 开启 的 。 你 可 以 通过 尝试 导入 Tkinter 模 块 来 
判断 它 是 否 能 被 Python 解释 器 使 用 。 如 果 Tkinter 是 可 用 的 ， 不 会 出 现任 何 错误 : 


>>> import Tkinter 


222 


而 如 果 你 的 Python 解释 器 在 编译 时 没有 局 用 Tkinter， 导 入 过 程 将 失败 。 


>>> import Tkinter 


Traceback (innermost last): 


File "«stdin»", line 1l, in ? 
File "/usr/lib/pythonl.5/lib-tk/Tkinter.py", line 8, in ? 
import tkinter # If this fails your Python may not 
be configured for Tk 
ImportError: No module named tkinter 


这 时 你 不 得 不 重 编译 Python 解释 器 来 访问 Tkinter。 这 通常 会 涉及 编辑 Modules/Setup 文 件 和 局 

用 所 有 正确 选项 来 编译 你 的 Python 解释 器 ， 以 确保 Tkinter 能 被 选择 安装 在 系统 中 。 请 检查 你 

Python 发 行 包 中 的 README 文 件 ， 里 面 有 把 Tkinter 编 译 进 系统 的 操作 说 明 。 请 确定 你 编译 完 

后 启动 的 是 刚刚 创建 的 新 Python 解释 器 ， 否 则 它 会 像 那个 曰 的 不 含 Tkinter 的 解释 器 一 样 工作 
(实际 上 ， 它 就 是 你 那个 百 解 释 器 ) 。 


19.1.3 ”客户 端 /服务 器 架构 


在 之 前 介绍 的 网 络 编程 中 ， 我 们 介绍 了 客户 端 /服务 器 计算 模式 的 概念 。 窗 口 系统 就 是 软件 服 
务 器 的 另 一 个 例子 ， 它 们 运行 在 一 个 有 显示 设备 的 机 器 上 ， 比 如 带 有 一 个 某 种 类 型 的 显示 
器 。 当 然 还 有 客户 端 (那些 需要 窗口 环境 来 运行 的 程序 ， 也 就 是 我 们 所 说 的 GUI 程序 ) ， 这 些 
程序 无 法 脱离 窗口 系统 单独 运行 。 


这 种 架构 混合 网 络 应 用 将 显得 更 加 有 趣 。 通 常 一 个 GUI 程序 被 执行 时 会 在 启动 它 的 机 器 上 显示 
(通过 窗口 服务 器 ) ， 但 也 可 以 在 一 些 网 络 化 的 窗口 环境 中 (例如 Unix 的 XWindow 系 统 ) 选 


择 其 他 机 器 的 窗口 服务 器 去 显示 。 这 样 ， 你 就 可 以 在 一 台 机 器 上 运行 GUI 程序 而 在 另 一 台 机 器 
上 显示 它 ! 


19.2 Tkinter 与 Python 编 程 


19.2.1 Tkinter 模 块 : 把 Tk 引入 你 的 程序 


为 了 让 Tkinter 成 为 你 程序 的 一 部 分 ， 应 该 怎么 做 呢 ? 这 并 不 是 说 你 一 定 要 先 有 一 个 应 用 程 
序 。 只 要 你 愿意 ， 当 然 可 以 创建 一 个 纯粹 的 GUI 程 序 ， 但 如 果 没 有 让 人 感 泊 趣 的 功能 的 话 ， 
个 程序 也 许 不 会 很 有 用 。 


要 创建 并 运行 你 的 GUI 程序 ， 下 面 五 步 是 基本 的 。 

1. 导 入 Tkinter 模 块 (import Tkinter 或 者 from Tkinter import*) ° 

2. 创 建 一 个 顶层 窗口 对 象 ， 来 容纳 你 的 整个 GUI 程序 。 

3. 在 你 的 顶层 窗口 对 象 上 (或 者 说 在 “其 中 ”) 创建 所 有 的 GUI 模块 〈 以 及 功能 ) 。 

4. 把 这 些 GUI 模 块 与 底层 程序 代码 相连 接 。 

5. 进 入 主事 件 循环 。 

第 一 步 很 明显 : 所 有 使 用 Tkinter 的 GUI 程序 必须 先导 入 Tkinter 模 块 。 第 一 步 就 是 为 了 获得 
Tkinter 的 访问 权 (参见 19.1.1 小 节 ) 。 

19.2.2 GUI 程序 开发 简介 


在 举例 之 前 ， 我 们 将 先 从 宏观 上 来 给 你 简单 介绍 一 下 GUI 程 序 开 发 。 
一 些 必要 的 背景 知识 o 


J% 
内 
分 


后 的 学 习 提 供 


创建 GUI 程序 与 画家 作画 有 些 相 似 。 通 常 画 家 只 会 在 一 块 画布 上 开展 自己 的 创作 。 工 作 步 骤 或 

许 是 这 样 的 : 首先 要 找 来 一 块 干净 的 石板 ， 你 将 在 这 个 “顶层 "窗口 对 象 上 创建 所 有 其 他 模块 。 
可 以 把 这 一 步 想 象 成 一 座 房屋 的 地 基 或 者 某 个 画家 的 画 架 。 换 言 之 ， 在 搭建 各 实物 或 展开 画 
布 之 前 ， 你 必须 先 给 地 基 洲 灌 好 混凝土 或 者 架 好 画 架 。 对 Tkinter 而 言 ， 这 个 基础 被 称 为 顶层 
窗口 对 象 。 


在 GUI 程序 中 ， 会 有 一 个 顶层 根 窗口 对 象 ， 它 包含 着 所 有 小 窗口 对 象 ， 它 们 共同 组 成 一 个 完整 
的 GUI 程序 。 这 些小 窗口 对 象 可 以 是 文字 标签 、 按 钮 、 列 表 框 等 等 。 这 些 独立 的 GUI 构件 就 是 
所 谓 的 组 件 。 所 以 当 我 们 说 创建 一 个 顶层 窗口 的 时 候 ， 我 们 实际 上 是 指 你 需要 一 个 放置 所 有 
组 件 的 地 方 。 典 型 的 Python 语 句 如 下 行 : 


top Tkinter.Tk() & 如 果 上 文 是 "Erzom Tkinter import *"，Tk() 就 够 了 


Tkinter. Tk() 返 回 的 对 象 通常 被 称 作 根 窗口 ， 正 因为 如 此 ， 有 些 程序 用 root 来 指示 它 ， 而 非 
top ° 顶层 窗口 是 指 那些 在 你 的 程序 中 独立 显示 的 部 分 。 你 可 以 在 GUI 程序 中 创建 多 个 顶层 窗 
口 ， 但 它们 中 只 能 有 一 个 是 根 窗口 。 你 可 以 采用 先 完全 设计 好 组 件 再 添加 实际 功能 的 开发 方 
式 ， 也 可 以 二 者 同时 进行 。 (这 意味 着 交替 执行 上 述 5 步 中 的 第 3 步 和 第 4 步 。) 

组 件 既 可 以 是 独立 的 也 可 以 作为 容器 存在 。 如 果 一 个 组 件 “ 包 含 "其 他 组 件 ， 它 就 被 认为 是 


X 
组 件 的 父 组件 。 相 应 地 ， 如 果 一 个 组 件 被 “包含 "在 其 他 组 件 中 ， 它 就 被 认为 是 父 组 件 的 孩子 
父 组 件 则 是 直接 包围 其 外 的 那个 容器 组 件 。 


此 
, 


通常 ， 组 件 会 有 一 些 相应 的 行为 ， 例 如 按钮 被 按 下 ， 或 者 文本 框 被 写 入 。 这 种 形式 的 用 户 行 
为 被 称 为 事件 ， 而 GUI 程序 对 事件 所 采取 的 响应 动作 被 称 为 回调 。 


用 户 操作 包括 按 下 (以 及 释放 ) 按钮 、 移 动 和 鼠标 、 按 下 RETURN 或 Enter 键 等 等 ， 所 有 的 这 些 
从 系统 角度 都 被 看 作 事件 。GUlI 程 序 正 是 由 这 伴随 其 始末 的 整套 事件 体系 所 驱动 的 。 这 个 过 程 
被 称 作 事件 驱动 处 理 。 


一 个 事件 及 其 回调 的 例子 是 鼠标 移动 。 我 们 假设 鼠标 指针 停 在 你 GUI 程序 的 某 处 。 如 果 鼠 标 被 
移 到 了 程序 的 别处 ， 一 定 是 有 什么 东西 引起 了 屏幕 上 指针 的 移动 ， 从 而 表现 这 种 位 置 的 转 

移 。 系 统 必 须 处 理 这 些 鼠 标 移动 事件 才能 展现 〈 并 实现 ) 鼠标 在 窗口 上 的 移动 。 一 旦 你 释放 
了 鼠标 ， 就 不 再 会 有 事件 需要 处 理 ， 相 应 地 ， 屏 幕 上 的 一 切 又 复归 平静 。 


GUI 程序 的 事件 驱动 特性 恰好 体现 出 它 的 客户 端 /服务 器 架构 。 当 你 启动 一 个 GUI 程序 时 ， 它 必 
须 执 行 一 些 初始 化 例 程 来 为 核心 功能 的 运行 做 准备 ， 正 如 局 动 一 个 网 络 服务 器 时 必须 先 申 请 
一 个 套 接 字 并 把 它 绑 定 在 一 个 本 地 地 址 上 一 样 。Tk 有 两 个 坐标 管理 器 用 来 协助 把 组 件 放 在 正 
确 的 位 置 上 ; 你 将 经 常用 到 的 一 个 称 为 “ 包 ”， 亦 即 packer。 另 一 个 坐标 管理 器 是 网 格 

(Grid) 。 你 可 以 用 它 来 把 GUI 组 件 放 在 网 格 坐标 系 中 ，Grid 将 依据 GUI 中 的 网 格 坐标 来 生成 
每 个 对 象 。 我 们 将 紧 扣 packer 讲 解 。 

一 旦 packer 决 定好 你 所 有 组 件 的 尺寸 和 对 齐 方式 ， 它 将 为 你 在 屏幕 上 放置 它们 。 当 所 有 这 些 
组 件 ， 包 括 顶 层 窗口 ， 最 终 显 示 在 你 屏幕 上 时 ，GUI 程 序 就 会 进入 一 个 “服务 器 式 " 的 无 限 循 
环 。 这 个 无 限 循环 包括 等 待 GUI 事 件 、 处 理事 件 、 然 后 返回 等 待 模式 ， 等 待 下 一 个 事件 。 
上 述 最 后 一 步 说 明 所 有 组 件 就 绪 后 立即 进入 主 循环 。 这 正 是 我 们 提 及 的 “服务 器 式 " 无 限 循 环 。 
对 Tkinter 而 言 ， 相 应 代码 如 下 : 


Tkinter.mainloop() 


这 通常 是 你 程序 执行 的 最 后 一 段 代码 。 一 旦 进入 主 循环 ，GUlI 便 从 此 掌握 控制 权 。 所 有 其 他 动 
作 都 来 自 回调 函数 ， 包 括 程序 退出 。 当 你 拉 下 文件 菜单 点 击 “ 退 出 ?菜单 项 或 直接 关闭 窗口 时 ， 
必须 要 唤起 一 个 回调 来 结束 你 的 程序 。 

19.2.3 ”顶层 窗口 : Tkinter.Tk() 


我 们 前 面 提 到 所 有 的 主要 组 件 都 建立 在 顶层 窗口 对 象 内 。 这 个 对 象 是 由 Tkinter 中 的 Tk 类 创建 
的 ， 并 且 是 由 普通 构造 器 创建 的 : 


>>> import Tkinter 
=>> top - Tkinter.Tk() 


在 这 个 窗口 中 ， 你 可 以 放置 独立 组 件 或 集成 的 模块 来 构建 你 的 GUI。 那 么 ， 都 有 哪些 组 件 可 用 
呢 ? 我 们 下 面 就 来 介绍 Tk 组 件 。 


19.2.4 Tk 组 件 


Tk 目前 有 15 种 组 件 。 我 们 在 表 19.1 中 列 出 了 它们 。 


我 们 不 准备 对 所 有 TKk 组 件 都 一 一 详细 讲解 ， 因 为 已 经 有 许多 关于 它们 的 很 好 的 文章 可 供 参 考 
不 论 是 从 Python 网 站 的 Tkinter 主 题 页 面 还 是 数量 可 观 的 Tecl/Tk 印 刷 品 ， 抑 或 是 在 线 资源 
(其 中 一 些 可 以 在 附录 B 中 找到 ) 。 然 而 ， 我 们 将 讲解 一 些 例子 来 帮 你 启 航 。 
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X 19.1 Tk 组 件 
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核心 笔记 : 默认 参数 是 你 的 朋友 


GUI 开 发 从 Python 的 缺 省 参数 机 制 获 益 匪 浅 ， 因 为 Tkinter 组 件 有 大 量 的 默认 动作 。 除 非 你 熟 
án Á SUAM S me Tm 选项 ， 否 则 最 好 只 设置 你 关心 的 参数 而 把 其 他 的 交 由 
系统 处 理 。 这 些 缺 省 值 是 精心 选 出 的 。 


如 果 你 没有 提供 这 些 值 也 不 必 担心 程 序 会 在 屏幕 上 表现 怪异 。 作 为 一 条 基本 规则 ， 程 序 都 由 
一 系列 经 优化 的 缺 省 值 创 建 ， 并 且 只 有 当 你 明确 知道 如 何 配置 你 的 组 件 时 ， 才 有 必要 用 自己 
的 值 蔡 换 这 些 缺 省 值 。 

例 19.1 


我 们 的 第 一 个 Tkinter 例 子 是 ...... 还 能 是 什么 呢 ?“Hello World!" £c £& 36x > 绍 我 们 的 第 
个 组 件 : 标签 。 

#!/usr/bin/env python 

import Tkinter 

top = Tkinter.Tk() 

label = Tkinter.Label(top, text*'Hello World!*) 


label.pack() 
Tkinter.mainloop() 


© -3 06 U A ww Mm e 


19.3 Tkinter: | 


19.3.1 标签 组 件 
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在 例 19.1 中 ， 我 们 展示 了 Tkinter 版 的 “Hello World! 一 一 tkhellol.py 实 际 上 ， 它 利用 组 件 向 你 展 
示 了 如 何 创建 一 个 Tkinter 应 用 程序 
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19-1 Tkinter 标 签 组 件 (tkhello.py ) 


第 一 行 ， 我 们 先 创 建 了 一 个 顶层 窗口 。 随 后 是 写 着 那 串 举世 闻名 的 字符 的 标签 组 件 。 我 们 指 
明 用 packer 来 管理 和 显示 组 件 ， 并 最 终 调用 mainloop() 来 运行 GUI 程序 。 图 19-1 展 示 了 运行 该 
GUI 程序 后 ， 你 将 会 看 到 的 效果 。 


19.3.2 按钮 组 件 

第 二 个 例子 和 第 一 个 很 相似 。 但 我 们 这 次 将 创建 一 个 按钮 而 不 只 是 显示 一 个 简单 的 文字 标 
签 。 例 19.2 是 tkhello2.py 的 源码 。 

例 19. 2 

本 例 和 tkhellol.py 完 全 相同 ， 除 了 我 们 创建 的 是 按钮 组 件 而 非 标签 组 件 。 


#!/usr/bin/env python 


import Tkinter 


top = Tkinter.Tk() 
quit Tkinter.Button(top, text*'Hello Worild!', 
commandstop.quit) 


quit.pack() 


wo C -J) d i 4 QG N €f 


Tkinter.mainloop() 


前 面 几 行 是 相同 的 ， CR 1 建 的 是 按钮 组 件 。 我 们 的 按钮 有 一 个 额外 的 参数 ， 
Tkinter. quit() 方 法 。 这 将 给 我 们 的 按钮 安装 一 个 回调 RNC , Dodd (并 释放 ) 后 让 整个 程 
序 退 出 。 最 后 的 两 行 是 通常 的 pack() 和 进入 mainloop()。 这 个 简单 的 按钮 应 用 程序 展示 在 图 
19-2 中 。 
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图 19-2 Tkinter 标 签 组 件 (tkhellol.py) 


19.3.3 标签 和 按钮 组 件 


我 们 把 tkhellol.py 和 tkhello2.py 组 合 到 tkhello3.py 中 ， 得 到 一 个 同时 包含 标签 和 按钮 的 脚本 。 
另外 ， 我 们 现在 还 使 用 了 更 多 的 参数 ， 而 不 再 满足 于 完全 使 用 那些 自动 添 入 的 缺 省 参数 。 例 
19. 3 给 出 了 tkhello3.py 的 源码 。 


除了 对 组 件 新 加 的 参数 ， 我 们 还 看 到 对 packer 的 一 些 参数 。 人 il| 参 数 告诉 packeriQUIT 按 钮 圳 
充 水 平方 向 的 剩余 空间 ， 而 expand 参 数 则 引导 packer 填 充 了 水 平方 向 的 所 有 可 视 空间 ， 并 拉 
伸 按 钮 到 达 窗 口 的 左右 边界 。 


例 19.3 


本 例 同 时 展示 了 标签 和 按钮 组 件 。 既 然 我 们 已 经 了 解 了 按钮 组 件 和 如 何 配 置 它 ， 我 们 就 可 以 
设置 得 更 多 一 些 ， 而 不 必 像 以 前 那样 大 都 使 用 缺 省 参数 。 


1 t!/usr/bin/env python 


2 

3 import Tkinter 

4 top Tkinter.Tk() 

5 

6 hello = Tkinter.Label(top, text-'Hello World!') 
7 hello.pack() 

8 

9 quit = Tkinter.Button(top, text-'QUIT', 

10 commandetop.quit, bg='red', fg-'white') 


11 quit.pack(filleTkinter.X, expand-1) 
12 
13  Tkinter.mainloop() 


正如 你 在 图 19-3 中 看 到 的 ， 对 packer 没 有 其 他 指令 时 ， 组 件 是 按 垂 直 顺 序 放置 的 《依次 放 在 
其 他 组 件 的 上 面 ) 。 要 水 平 放置 则 需要 创建 一 个 框架 对 象 ， 再 用 它 来 添加 按钮 。 作 为 父 对 得 


的 唯一 子 对 象 ， 框 架 将 占据 父 对 象 的 空间 (参见 19.3.6 小 节 例 19.6 中 listdir.py 模 块 对 按钮 的 处 
理 ) o 
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图 19-3 Tkinter 标 签 和 按钮 控件 (tkhello3.py ) 


19.3.4 标签 、 按 钮 和 进度 条 组 件 


我 们 的 最 后 一 个 例子 tkhello4.py， 增 加 了 一 个 进度 条 组 件 。 具 体 来 说 ， 这 个 进度 条 是 用 来 和 标 
签 组 件 交互 的 。 进 度 条 的 滑 块 被 用 作 控 制 标 签 组 件 文本 大 小 的 工具 。 滑 块 的 位 置 值 越 大 字体 
就 越 大 ， 反 之 亦 然 ， 越 小 的 位 置 值 意味 着 越 小 的 字体 。 例 19.4 展 示 了 tkhello4.py 的 源码 。 


例 19.4 


我 们 最 后 一 个 组 件 例子 介绍 了 进度 条 组 件 ， 重 点 放 在 组 件 问 通过 回调 函数 的 交互 [诸如 
resize()]。 你 对 进度 条 组 件 的 动作 将 影响 标签 组 件 上 的 文字 。 
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1 #!/usr/bin/env python 


from Tkinter import * 


5 def resize(ev*None): 


9 top = Tk() 


10 top.geometry('250X150') 


11 
12 label Label (top, text*'Hello World!', 
13 fontes'Helvetica -12 bold') 


14 label.pack(fill-Y, expand-1) 


15 
16 scale Scale(top, from -10, to*40, 

orient*HORIZONTAL, command*resize) 
18 scale.set(12) 


19 scale.pack(fill-X, expand-1) 


20 

21 quit * Button(top, text-"QUIT", 

22 command*top.quit, activeforeground»*'white', 
23 activebackground»' red") 

24 quit.pack() 

25 


26 mainloop() 


这 段 脚本 新 增加 的 resizing() 回 调子 数 (5o 741). 附加 在 进度 条 组 件 上 。 这 段 代码 在 进度 条 的 
滑 块 被 移动 时 激活 ， 调 整 标签 里 文字 的 大 小 。 


我 们 还 限定 了 顶层 窗口 的 尺寸 (250x150) (1041) 。 这 段 脚 本 和 前 3 段 的 最 后 一 个 不 同 点 
Æ M “from Tkinter import ”把 Tkinter 模 块 的 属性 引入 我 们 的 名 称 空间 。 虽 然 不 建议 这 样 做 ， 
为 这 会 “污染 "你 的 名 称 空间 ， 但 这 个 程序 涉及 大 量 对 Tkinter 铅 性 的 引用 ， 这 正 是 我 们 这 样 做 的 
主要 原因 。 这 种 方式 ( 译 者 注 : 指 import Tkinter 的 方式 ) 要 求 访问 每 个 属性 时 都 使 用 它们 的 
全 部 限定 性 名 称 。 而 通过 这 种 不 被 推荐 的 快捷 方式 ， 我 们 可 以 在 访问 属性 时 减少 输入 并 且 让 
代码 易于 理解 ， 但 同时 也 付出 了 一 些 代 价 。 


正如 你 在 图 19-4 所 看 到 的 ， 滑 块 装 置 及 当前 位 置 值 都 显示 在 窗口 的 显著 位 置 。 图 19-4 展 示 了 
用 户 把 进度 条 / 滑 块 移动 到 36 时 的 GUI 程序 状态 。 


从 代码 中 可 以 看 出 ， 进 度 条 的 初始 值 在 程序 启动 时 被 设置 为 12 (第 18 行 ) 。 
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图 19-4 Tkinter 标 签 、 按 钮 和 滑 块 控件 (tkhello4.py ) 


19.3.5 偏 函 数 应 用 举例 


在 看 更 大 的 GUI 程序 之 前 ， 我 们 先 回顾 一 下 第 11 章 11. 7. 3 节 介 绍 的 偏 另 数 应 用 (Partial 
FunctionApplication, PFA) 。 
Python2. 5 新 增 了 PFA 等 一 系列 新 特性 ， 它 们 显著 提高 了 Python 对 函数 编程 的 支持 。 


偏 浮 数 允 许 你 “预存 "一 些 函 数 变量 并 有 效 地 “冻结 ”了 这 些 预定 参数 ， 在 运行 时 你 获得 了 所 需 的 
其 他 变量 后 再 把 它们 "解冻 "出 来 ， 用 这 些 最 终 确 定 的 参数 去 调用 函数 。 

最 妙 的 是 ，PFA 不 仅仅 局 限于 函数 。 它 们 对 任何 “可 调用 "的 东西 都 有 效 ， 任 何 有 有 子 数 接口 的 对 
象 ， 比 如 类 、 方 法 、 或 可 调用 对 象 ， 只 要 是 有 括号 的 。 对 于 有 许多 待 调 对 象 并 且 许 多 调用 都 

反复 使 用 相同 参数 的 情况 ， 用 PFA 是 最 合适 不 过 的 。 
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GUI 编程 有 很 好 的 操作 环境 ， 因 为 很 有 可 能 你 需要 GUI 组 件 有 某 些 一 致 的 外 观 和 体验 ， 而 这 些 
一 致 性 表现 在 可 以 使 用 相同 的 参数 创建 相似 的 对 象 。 我 们 现在 要 展示 的 应 用 程序 中 ， 将 有 多 
个 按钮 有 着 相同 的 前 景色 和 背景 色 。 对 这 些 仅 有 细小 差别 的 按钮 ， 每 次 调 相 同 的 构造 器 PM 
始 化 时 都 输入 些 相同 的 参数 实在 是 一 种 浪费 : 前 景 和 背景 色 都 一 样 ， 只 是 文字 有 细小 差别 。 


我 们 将 用 交通 指示 牌 作为 例子 ， 程 序 中 尝试 创造 一 种 文字 型 的 交通 指示 牌 ， 并 且 把 它们 分 成 
如 下 几 类 : 危急 、 警 告 、 通 知 (正好 和 日 志 信息 级 别 相 类 似 ) 。 指 示 牌 的 类 型 决定 了 它们 在 
创建 时 的 颜色 格局 。 例 如 ， 危 急 指示 牌 使 用 亮 红 文字 和 白色 背景 ， 警 告 指 示 牌 使 用 黑色 文字 
和 金色 背景 ， 通知 也 就 是 普通 指示 牌 使 用 黑色 文字 和 白色 背景 。 我 们 约定 “Do Not 
Enter" 和 “Wrong Way” 标 识 为 危急 ，“MergingTraffic" 和 “Railroad Crossinig” 标 识 为 警 
告 ，“Speed Limit* 和 “One Way" 标 识 为 通知 。 该 程序 创造 "指示 牌 "， 它 们 都 只 是 些 按钮 。 当 用 
户 点 下 按钮 时 ， 将 简单 地 弹出 一 个 Tk 响应 对 话 框 ， 显 示 危 急 /错误 、 警 告 、 通 知 。 这 的 确 不 够 
好 玩 ， 但 如 何 创 建 这 些 按钮 却 很 有 趣 。 你 将 在 例 19. 5 看 到 这 里 所 描述 的 程序 。 


例 19.5 运用 PFA 的 路 灯 指 示 牌 GUI 程 序 (pfaGUI2.py) 
按照 指示 类 型 创建 适当 前 景 、 背 景色 的 路 灯 指 示 牌 。 使 用 PFA 帮助 "模板 化 "常用 GUI 参数 。 


1 #!/usr/bin/env python 


3 from functools import partial as pto 
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from Tkinter import Tk, Button, X 


D 


from tkMessageBox import showinfo, showwarning, showerror 


WARN = 'warn' 


ERIT.. v 'erit' 


e -3 O6 uw 


w 
- 
m 
e 
e 

L] 
^ 
e 

ES 

c 
- 


11 SIGNS = | 


2 ‘do not enter’: CRIT, 

13 'railroad crossing': WARN, 
14 '55Xnspeed limit': REGU, 

5 'wrong way': CRIT, 

16 'merging traffic': WARN, 
17 'one way': REGU, 

18 ) 

19 


20 critCB = lambda: showerror('Error', 'Error Button Pressed!") 


21  warnCB * lambda: showwarning('Warning', 


22 'Warning Button Pressed!") 
23  infoCB - lambda: showinfo('Info', 'Info Button Pressed!') 
24 


25 top = Tk() 
26 top.tíitle('Road Signs') 


27 Button(top, texte'QUIT', commandetop.quit, 


28 bgs'red', fg-'white').pack() 
29 
30 MyButton = pto(Button, top) ; 


31  CritButton = pto(MyButton, command*critCB, bge'white', fge'red') 
32  WarnButton = pto(MyButton, commandeswarnCB, bgs'goldenrodl') 
33  ReguButton = pto(MyButton, commandesinfoCB, bgs'white"') 


35 for eachSign in SIGNS: 


36 signType = SIGNS[eachSign] 
37 cmd = '*&sBotton(texte€*5rts).pack(fill*X, expandeTrue)*' * ( 
38 signType.title(), eachSign, 
39 ',upper()' if signType == CRIT else '.title()"') 
0 eval(cmd) 
41 


42 top.mainloop() 
当 你 执行 这 个 程序 时 ， 会 看 到 一 个 类 似 图 19-5 的 GUI 。 
逐 行 解释 
1~ 18 行 


和 
后 ， 我 们 定义 了 一 些 标识 及 其 相应 类 型 。 


20 ~ 28 行 


Tk 对 话 框 被 关联 到 按钮 回调 函数 ， 我 们 将 在 创建 按钮 时 使 用 它们 (20~23 行 ) 。 然 后 加 载 
Tk， 设 置 标题 ， 并 创建 了 一 个 QUIT 按 钮 (25—2841) ° 


30 ~ 33 行 
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些 行 展示 了 PFA 的 魔力 。 我 们 通过 两 个 步骤 实现 PFA。 第 一 步 是 模板 化 的 按钮 类 及 根 窗口 
的 。 这 样 当 每 次 我 们 调用 MyButton 时 ， 它 会 转 而 调用 Button (Tkinter. Button() 创 建 了 一 个 按 
42) 并 使 用 top 作 为 其 第 一 个 参数 。 我 们 把 这 一 切 “ 冻 结 "在 了 MyButton 里 。 


PFA 的 第 二 步 使 用 了 第 一 步 的 结果 一 “MyButton， 并 再 次 对 它 模板 化 。 我 们 对 每 个 不 同 的 指 
示 类 型 都 创建 了 单独 类 型 的 按钮 。 当 用 户 创 建 一 个 危急 按钮 CritButton 时 (通过 调用 
CritButton()) ， 它 会 转 而 调用 MyButton 并 使 用 恰当 的 按钮 回调 和 前 景 、 背 景色 参数 ， 这 意味 
着 用 top、 按 钮 回调 、 前 景 、 后 景 去 调用 Button。 你 看 出 它 是 如 何 展开 并 逐步 调用 低层 直到 按 
钮 组 件 了 吗 ? 如 果 没 有 PFA 这 个 特性 ， 它 执行 的 那些 调用 本 该 由 你 自己 执行 。 我 们 把 同样 的 步 
骤 应 用 到 WarnButton 和 ReguButton 上 。 


35 ~ 42 行 


按钮 类 创建 过 程 结束 后 ， 我 们 遍历 了 指示 列表 并 创建 出 指示 牌 。 我 们 使 用 了 一 个 Python 求 值 
字 事 ， 它 由 正确 的 按钮 名 字 、 作 为 按钮 标签 传 入 的 text 参 数组 成 ， 然 后 再 pack() 一 下 。 如 果 这 
是 个 危急 指示 牌 ， 我 们 就 把 按钮 文字 全 转 成 大 写 ， 否 则 的 话 就 以 标题 形式 显示 。 最 后 一 步 在 
第 39 行 完成 ， 同 时 也 展示 了 Python2. 5 引入 的 另 一 个 特性 ， 临 时 操作 符 。 随 后 我 们 对 每 一 个 按 
钮 创建 字 串 施 以 eval()， 每 次 创建 一 个 按钮 ， 最 终 形成 了 前 面 看 到 的 图 形 。 最 后 我 们 进入 主事 
件 循环 ， 启 动 GU1。 


这 个 应 用 程序 使 用 了 一 些 Python2.5 的 新 特性 ， 所 以 你 不 能 在 昌 版 上 运行 它 。 
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WS m ON G WAY 


DO NOT ENTER 





图 19-5 在 使 用 MacOSX 的 XDarwin 服 务 器 运用 PFA 的 路 灯 指 示 牌 GUI 应 用 程序 on 
XDarwin in MacOS X (pfaGUI2.py) 


19.3.6 "tZ Tkinter 54 


我 们 以 一 个 比较 大 型 的 例子 来 总 结 本 节 ，listdirpy。 这 个 应 用 程序 是 一 个 目录 树 遍 历 工 具 。 它 
从 当前 目录 开始 并 提供 文件 列表 功能 。 双 击 列表 中 的 任意 其 他 目录 都 会 让 该 工具 转向 这 个 新 
的 目录 ， 同 时 用 新 目录 中 的 文件 列表 替换 原 有 的 文件 列表 。 源 码 作 为 例 19.6 给 出 。 


例 19. 6 


这 个 稍 高 级 一 些 的 GUI 程序 扩大 了 组 建 的 使 用 范围 ， 演 员 名 单 里 新 增 了 列表 框 、 文 本 框 和 滚动 
条 。 而 且 还 有 大 量 的 回调 函数 ， 例 如 鼠标 点 击 、 键 盘 输入 和 滚动 条 操作 。 
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#!/usr/bin/env python 


import os 
from time import sleep 


T 

2 

3 

4 

5 from Tkinter import * 
6 

7 class DirList (object): 
8 

9 


def _ init. (self, initdir=None): 


10 self.top * Tk() 

11 self.label - Label(self.top, 

12 text-'Directory Lister vl1.1') 
13 self.label.pack() 

14 

15 self.cwd = StringVar(self.top) 

16 
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17 self.dirl = Label(self.top, fg*'blue', 


18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 


font*(*'Helvetica', 12, 'bold')) 
seif.dirl.pack() 


self.dirfm = Frame(self.top) 
self.dirsb = Scrollbar(self.dirfm) 
self.dirsb.pack(side*RIGHT, fill«€Y) 


self.dirs = Listbox(self.dirfm, height=15, 
width-50, yscrollcommandeself.dirsb.set) 

self.dirs.bind('«Double-1»', self.setDirAndGo) 

self.dirsb.config(commandeself.dirs.yview) 


self.dirs.pack(side*-LEFT, fill«-BOTH) 
self.dirfm.pack() 


self.dirn = Entry(self.top, width-50, 

textvariable*self.cwd) 
self.dirn.bind('«Return»', self.doLS) 
self.dirn.pack() 


self.bfm = Frame(self.top) 

self.clr = Button(self.bfm, text-'Clear', 
comrand*-self.clrDir, 
activeforeground*-'white', 
activebackground* 'blue') 

self.ls = Button(self.bfm, 
text='List Directory', 
commandeself.doLS, 
activeforeground*'white*, 
activebackground*'green') 

self.quit = Button(self.bfm, texte-'Quit', 
command*self.top.quit, 
activeforegrounde'white', 
activebackground*' red') 

self.clr.pack(side-LEFT) 

self.ls.pack(sideeLEFT) 

self.quit.pack(side-LEFT) 

self.bfm.pack() 


if initdir: 
self.cwd.set(os.curdir) 
self.doLS() 


def clrDir(self, ev*None): 


self.cwd.set('") 


def setDirAndGo(self, ev*None): 


self.last = self.cwd.get() 
self.dirs.config(selectbackground*'red') 
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65 check = self.dirs.got(self.dirs.curselection()) 
66 if not check: 

67 check = os.curdir 

68 self.cwd,set (check) 

69 self.doLS() 

70 

71 def doLS(self, ev-None): 

72 error = '' 

73 tdir = self.cwd.get() 

74 if not tdir: tdir = os.curdir 

75 

76 if not os.path.exists(tdir): 

TT error = tdir + ': no such file' 
78 elif not os.path.isdir(tdir): 

79 error = tdir + ': not a directory’ 
80 

81 if error: 

82 seif,.cwd.set(error) 

83 s3e1f.top.update() 

84 sleepi2) 

85 if not (hasattr(self, 'last') \ 
86 and self.last): 

9? self.last = os.curdir 

BA self.cwd.setisolf. last} 

89 self.dirs.config(\ 

90 selectbackground*'LightSkyBlue') 
91 self.top.update () 

92 return 

93 

94 self.cwd.set (V 

95 '"FETCHING DIRECTORY CONTENTS...") 
96 self.top.update() 

97 dirlist = os.listdir(tdir) 

98 dirlist.sort() 

99 os.chdir(tdir) 

100 self.dirl.config(text"-os.getcwd()) 
101 self.dirs.delete(0, END) 

102 self.dirs.insert(END, os.curdir) 
103 self.dirs.insert(END, os.pardir) 

104 for eachFile in dirlist: 

105 self.dirs.insert(END, eachFile) 
106 self.cwd.set(os.curdir) 

107 self.dirs.config(^ 

108 selectbackgrounde'LightSkyBlue') 
109 


110 def main(): 


111 d = DirList(os.curdir) 
112 mainloop() 

113 

114 if name 5 == ' main ': 
115 main () 


在 图 19-6 中 ， 我 们 展示 了 Windows 环 境 中 的 GUI 外 观 。 
这 个 程序 的 Unix 版 本 在 图 19-7 中 展示 。 
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图 19-6 ”Windows 下 的 表 目录 GUI 应 用 程序 (listdir.py) 
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Unix 





图 19-7 Unix 下 的 表 目 录 GUI 应 用 程序 (Listdir.py ) 
逐 行 解释 
1~5 行 
开始 的 几 行 包括 通常 的 Unix 启 动 行 和 导入 os 模块 、time.sleep 苞 数 及 Tkinter 模 块 的 所 有 属性 。 
9 ~ 13 行 


这 些 行 定义 了 DirList 类 的 构造 器 ， 以 及 一 个 代表 我 们 程序 的 对 象 。 我 们 创建 的 第 一 个 标签 包含 
了 应 用 程序 的 主 标题 和 它 的 版 本 号 。 


15 ~ 19 行 


我 们 声明 了 一 个 名 为 cwd 的 Tk 变量 来 保存 当前 所 在 目录 的 名 字 一 一 我 们 马上 就 会 看 到 这 个 值 从 


哪 来 。 还 创建 了 另 一 个 标签 来 显示 当前 目录 的 名 字 。 
21 ~ 29 行 


这 段 代 码 定 义 了 我 们 这 个 GUI 程序 的 核心 ，dirs (列表 框 ) 包含 了 被 列 目录 的 文件 列表 。 使 用 
一 个 滚动 条 以 便 用 户 在 文件 数目 超过 列表 框 窗口 尺寸 时 移动 列表 。 这 两 个 组 件 都 包含 在 一 个 
框架 组 件 中 。 列 表 框 用 bind() 方 法 把 回调 函数 (setDirAndGo) 和 列表 项 绑 定 起 来 。 


绑 定 意味 着 把 一 个 回调 函数 连接 在 键盘 输入 、 和 鼠标 动作 或 其 他 什么 事件 上 ， 当 这 个 事件 被 用 
户 触发 时 就 会 执行 这 个 回调 函数 。 当 列表 框 中 的 任 一 项 被 双击 时 setDirAndGo() 函 数 就 会 被 调 
用 。 滚 动 条 被 Scrollbar. config() 方 法 贴 附 在 列表 框 上 。 

31 ~ 34 行 


随后 我 们 创建 了 一 个 文本 框 让 用 户 输入 目录 名 ， 以 便 转 到 他 /她 想 去 的 目录 ， 并 在 列表 框 中 显 
示 该 目录 中 的 文件 。 我 们 为 该 文字 输入 区 加 入 了 一 个 RETURN 或 Enter 键 的 绑 定 ， 这 样 用 户 就 
能 用 斋 RETURN 的 方法 代替 按钮 点 击 ， 同 样 的 事 也 会 发 生 在 上 面 提 到 的 列表 框 中 。 当 用 户 双 
击 列 表 项 时 ， 效 果 等 同 于 用 户 在 文本 框 中 输入 目录 名 然后 点 击 “g0” 按 钮 。 

36 ~ 53 行 


接 下 来 我 们 定义 了 一 个 按钮 框架 (bfm) 来 保管 这 三 个 按钮 : 一 个 "clear 按钮 (clr) » — 
个 “go” 按 钮 (ls) 和 一 个 “quit 按钮 (quite) 。 每 一 个 按钮 都 有 各 自 不 同 的 配置 和 点 击 时 的 回 
调 函数 。 


55 ~ 57 行 
构造 器 的 最 后 一 部 分 初始 化 了 这 个 GUI 程序 ， 程 序 将 从 当前 工作 目录 开始 。 
59 ~ 60 行 


clrDir() 方 法 清空 Tk 字 符 串 变量 cwd， 其 中 保存 着 当前 的 “活动 "目录 。 这 个 变量 用 来 跟踪 我 们 当 
前 所 处 的 目录 ， 更 重要 的 是 ， 在 错误 发 生 时 协助 返回 上 一 个 目录 。 你 一 定 注 意 到 了 回调 函数 
中 的 ev 参数 的 缺 省 值 是 None。 这 样 的 任意 值 都 可 能 由 窗口 系统 传 回 ， 它 们 在 你 的 回调 函数 里 
可 以 用 也 可 以 不 用 。 


62 ~ 69 行 

setDirAndGo() 方 法 设置 了 要 到 达 的 目录 并 产生 一 个 对 doLS() 方 法 的 调用 ， 后 者 负责 实现 其 余 
的 一 切 。 

71 ~ 108 行 

现在 看 来 ，doLS() 是 整个 GUI 程序 的 关键 。 它 负责 所 有 的 安全 性 检查 (目标 是 否 是 一 个 目录 以 
及 它 是 否 存在 ?2 ) 如 果 有 错误 发 生 ， 最 终 目 录 会 被 设置 为 当前 目录 。 如 果 一 切 正确 ， 它 调用 
os. listdir() 来 取得 新 的 文件 集合 并 替换 列表 框 中 的 列表 。 当 后 台 忙 于 获取 新 目录 信息 时 ， 高 亮 
的 蓝 色 条 会 变 成 之 红色 。 当 新 目录 设置 完毕 ， 它 会 恢复 蓝 色 。 

110 ~ 115 行 


listdirpy 中 的 最 后 一 段 代码 明显 是 代码 的 主体 。main() 有 函数 只 有 在 该 脚本 被 直接 调用 时 才 会 执 
行 ， 并 且 当 它 执行 时 会 创建 GUI 程序 ， 后 者 随 之 掌控 该 程序 。 


我 们 把 该 程序 的 所 有 其 他 方面 都 留 给 读者 作为 练习 ， 再 次 提醒 ， 把 整个 程序 看 成 是 一 系列 组 
件 和 功能 的 组 合 ， 一 切 就 都 会 简单 起 来 。 如 果 你 清楚 地 知道 每 个 单独 程序 段 的 意思 ， 那 么 整 
个 脚本 就 不 会 再 显得 可 怕 了 。 


但 愿 我 们 给 了 你 一 个 够 好 的 关于 Python 和 Tkinter 的 GUI 编 程 介绍 。 请 记 住 熟悉 Tkinter 编 程 最 
好 的 方法 就 是 实践 和 模仿 一 些 例子 ! Python 发 行 包 附带 了 很 多 可 供 你 学 习 的 应 用 程序 范例 。 


如 果 你 下 载 了 源码 包 . 就 会 在 Lib/lib-tk、Lib/idlelib 和 Demol/tkinter 下 发 现 Tkinter 的 演示 代码 。 如 
果 你 把 Win32 版 本 的 Python 安装 在 C: \Python2. x， 那 么 可 以 在 Lib\lib-tk 和 Lib\idlelib 下 找到 这 
些 演示 代码 。 最 后 那个 目录 包含 了 最 出 名 的 Tkinter 例 子 程序 : IDLEIDE 本 身 。 还 有 一 些 关于 
Tk 编程 的 书籍 供 进一步 参考 ， 其 中 一 本 是 专 为 Tkinter 编 写 的 。 


19.4 其 他 GUI 简介 


我 们 期 望 最 终 能 编写 出 独立 的 一 章 来 对 GUI 编 程 作 总 体 介绍 ，Python 拥 有 的 大 量 图 形 工具 集中 
有 很 多 内 容 值得 一 讲 ， 然 而 ， 这 只 能 是 以 后 的 事 了 。 作 为 替代 ， 我 们 将 使 用 其 中 4 种 比较 流行 
且 可 用 的 工具 集 来 编写 同一 个 GUI 程序 例 : Tix (Tk Interface eXtensions) ^ Pmw (Python 
MegaWidgets 的 Tkinter 扩 展 ) 、wxPython 《wxWidgets 的 Python 绑 定 ) 和 PyGTK (GTK+ 的 
Python 绑 定 ) 。 你 可 以 在 本 章 末 尾 参 考 部 分 获取 更 多 信息 和 下 载 这 些 工 具 集 的 地 方 。 


Tix 模 块 包含 在 Python 标准 库 中 ， 已 经 可 用 了 。 其 他 工具 集 是 第 三 方 的 ， 你 必须 自己 下 载 。 因 
为 Pmw 只 是 对 Tkinter 的 一 个 扩展 ， 它 的 安装 是 最 简便 的 (只 需 解压 到 你 的 网 络 包 目录 下 ) 。 
wxPython 和 PyGTK 涉 及 下 载 多 个 文件 并 编译 (除非 你 使 用 的 是 Win32 版 本 ， 这 样 的 话 通常 有 
安装 包 可 用 ) 。 一 旦 这 些 工具 集 安装 好 并 通过 证 ， 我 们 就 能 开始 了 。 我 们 不 打算 局 限 在 本 章 
已 经 讲 过 的 那些 组 件 上 ， 我 们 准备 在 后 面 的 例子 中 介绍 一 些 更 复杂 的 组 件 。 


除了 我 们 已 经 看 到 过 的 标签 和 按钮 组 件 ， 我 们 还 准备 介绍 控制 按钮 (Control， 又 叫 微 调 按 
42 > SpinButton) 和 组 合 框 组 件 (ComboBox) 。 控 制 组 件 是 一 个 文本 组 件 和 一 对 箭头 按钮 
的 组 合 ， 文 本 值 受 旁 边 按钮 的 "控制 "或 者 说 “ 旋 上 、 旋 下 "， 而 组 合 框 则 通常 包括 一 个 文本 组 件 
和 一 个 下 拉 菜 单 ， 菜 单项 列表 中 当前 激活 或 选中 的 项 目 将 显示 在 文本 组 件 中 。 

我 们 的 应 用 程序 相当 简单 : 成 对 的 动物 要 被 搬 走 ， 动 物 的 总 数 在 从 一 对 到 一 打 (12A) 的 范 
围 内 。 用 控制 组 件 来 显示 总 数 ， 用 组 合 框 显 示 动 物种 类 列表 菜单 供用 户 选择 。 注 意 默认 的 动 
物 数量 是 2， 且 没有 选择 动物 类 型 。 

一 旦 我 们 开始 执行 这 个 程序 ， 事 物 就 变 得 不 同 了 ， 图 19-9 就 是 例证 ， 它 显示 的 是 在 Tix 程 序 中 
改变 一 些 元 素 后 的 结果 。 
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图 19-9 修改 我 们 应 用 程序 的 Tix GUI 版 本 后 (animalTix.pyw) 
下 面 ， 你 将 看 到 所 有 4 个 版 本 的 GUI 程序 代码 。 你 会 发 现 尽管 它们 有 些 相 似 ， 但 每 一 个 都 有 自 


己 的 特别 之 处 。 而 且 我 们 使 用 。pyw 作 为 文件 后 级 ， 这 样 可 以 防止 弹出 Dos 命 令 窗口 或 终端 窗 
Qo 


19.4.1 Tk Interface eXtensions (Tix) 
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我 们 从 一 个 使 用 Tix 模 块 的 例子 (19. 7) 开始 。Tix 是 对 Td/T ( 译 者 注 : 应 该 是 Tcl/Tk， 应 为 作 
者 笔 误 ) 的 一 个 扩展 库 ， 其 中 增加 了 许多 新 的 组 件 、 图 像 类 型 和 其 他 一 些 命令 ， 提 高 Tk 作为 
GUI 开发 工具 集 的 可 用 性 。 我 们 现在 来 看 看 如 何在 Python 中 使 用 Tix。 


例 19.7 Tix GUI 编程 演示 (animalTix.pyw ) 


我 们 的 第 一 个 例子 使 用 Tix 模 块 。Tix 已 经 是 Python 的 一 部 分 了 ! 


t k alí('packag equ 
! lt 3 
l t ima pair pa ma d 
11 pi 
12 
13 = p ak r 
14 AX < < va 
15 t ik 1 ( 1 14 bold') 
E t.pack( 
boE I: i f table»True) 
for animal in *, yth 
2 } ( 
b.p 
qb X 
J fq='w ) 
qp. } 
top.m pt) 
^ 7 
4T ARAE 
A- 
1741 


这 里 都 是 些 初 始 化 代码 ， 模 块 导 入 操作 ， 以 及 基本 的 GUI 操作 。 第 7 行 的 断言 要 求 程 序 可 以 使 
用 Tix 模 块 。 


8 ~ 27 行 


这 些 行 创建 了 所 有 的 组 件 : 标签 (9~11 行 ) 、 控 制 (13~16 行 ) ` MAAE (1821/1) fei 
出 按钮 (23~25 行 ) 。 组 件 构造 器 里 的 参数 都 很 浅显 明了 无 需 更 多 解释 。 最 后 ， 我 们 在 第 27 
行进 入 GUI 主事 件 循环 。 


19.4.2 Python MegaWidgets (PMW) 


下 面 通过 例 19. 8 让 我 们 来 看 看 Python MegaWidgets。 这 个 模块 体现 了 Tkinter 悠 久 的 历史 。 它 
基本 上 是 通过 在 GUI 工具 集中 添加 一 些 新 式 的 组 件 来 延长 Tkinter 的 寿命 。 


这 个 Pmw 的 例子 和 上 面 Tix 的 例子 是 如 此 相似 ， 以 致 我 们 不 准备 对 读者 逐 行 解释 它 。 代 码 中 区 
别 最 大 的 一 行 是 控制 组 件 的 构造 器 ， 那 个 Pmw 的 控制 组 件 。 它 提供 了 验证 函数 的 入 口 。 不 同 
于 直接 在 组 件 构造 器 中 以 关键 字 参 数 的 形式 传 入 最 大 、 最 小 值 ，Pmw 使 用 "验证 器 "来 确保 值 不 
会 超出 我 们 可 接受 的 范围 。 


现在 我 们 终于 要 离开 Tk 的 世界 了 。Tix 和 Pmw 分 别 扩 展 了 Tk 和 Tkinter， 然 而 我 们 现在 将 改变 方 
向 去 看 看 完全 不 同 的 工具 集 ， 即 wxWidgets 和 GTK+。 在 使 用 这 些 现代 的 、 健 壮 的 GUI 工 具 集 
时 ， 你 将 发 现代 码 的 行 数 增加 了 ， 这 是 因为 我 们 使 用 了 更 多 的 面向 对 象 特 性 。 


19.4.3 wxWidgets 和 wxPython 


wxWidgets (以 前 称 作 wxWindows) 是 一 个 跨 平台 的 工具 集 ， 用 来 构建 图 像 用 户 程序 。 它 用 
C++ 实现 并 在 各 种 平台 上 广泛 使 用 ，wxWidgets 为 这 些 平台 定义 了 一 致 、 通 用 的 API。 
wxWidgets 最 大 的 优点 是 它 在 每 个 平台 上 都 使 用 原生 GUI， 所 以 你 的 程序 将 和 所 有 其 他 桌面 程 
序 有 相同 的 外 观 和 用 户 体验 。 另 一 个 特点 是 你 不 会 被 局 限于 使 用 C++ 开发 WXxWidgets 应 用 程 
序 。 它 有 对 Python 和 Penl 的 接口 。 


例 19.8 使 用 wxPython 展 示 了 我 们 那个 动物 应 用 程序 。 
例 19. 8 


我 们 的 第 二 个 例子 使 用 Python MegaWidgets 包 。 
i! /usr/bin/env python 


from Tkinter import Button, END, Label, W 


from Pmw import initialise, ComboBox, Counter 


U^ 4 UU N rk 


6 top = initialise() 


8 lb I l p 

} tex Animal in pa 1 1 max n)"') 

1 b.packt) 

l = Counter (top, labelpos*W, label tex m 

1 atatype* | entry l ìlu 

14 r rente ntryfieid validat a 

1 iteger min' max 

1 ct.pack() 

17 

l t Com Box (tor l r W, | text Tyg 
for anin in ('dog', 1 'ham pyth 

) t isert(e iima 


3 c Button ( e 
< command p.q g"'red w 
a pack 
27 top.mainloop() 
4T 6 
逐 行 解释 


5 ~ 37 行 


这 里 我 们 先 编写 了 一 个 框架 类 (5~8 行 ) ， 它 的 唯一 成 员 即 其 构造 器 。 这 个 方法 的 唯一 实用 

目的 就 是 创建 我 们 的 组 件 。 在 框架 组 件 中 ， 我 们 创建 了 一 个 画板 组 件 (panel) 。 在 画板 中 我 
们 用 BoxSizer 来 包含 所 有 其 他 组 件 并 对 其 布局 (第 10 行 和 第 36 行 )， 这 些 组 件 是 标签 (12~ 
14 行 )、 微 调 按钮 (16—2041) ^ PD EIE (22~27 行 ) 和 退出 按钮 (29—3441) ° 


例 19.9 wxPython GUI 演 示 (animal Wx.pyw) 


我 们 的 第 三 个 例子 使 用 wxPython 及 WxWidgets。 注 意 我 们 把 所 有 的 组 件 都 放 在 一 个 布局 管理 
器 里 ， 以 及 该 程序 中 更 多 的 面向 对 象 本 质 。 


tb!/vusr/bin/env python 


import wx 
class My i (wx a 
t def nit (self, parent d ] tl 
wx.Frame. (5e1 parent t 
B ize-(200, 1 ) ) 
p = wx.Pan 1 
ize wx.Box (wx. VERTICAL) 
= Wwx.t t(3, WX ^ WX RMAL, wx.BOLD) 
ll W 1 xti l 
"A 11 ( pai pair, max iczen 
sizer dd (1b 
l WX at x«t ( } ) 
etr tí t 


我 们 不 得 不 手工 为 微调 按钮 和 组 合 框 组 件 添加 标签 ， 因 为 它们 看 起 来 并 不 包含 标签 。 一 旦 我 
们 创建 好 这 些 ， 就 把 他 们 加 到 布局 管理 器 中 ， 再 把 布局 管理 器 交 给 画板 组 件 ， 并 确定 其 中 每 
个 组 件 的 布局 。 你 会 注意 到 第 10 行 说 明 布 局 管理 器 是 重 直 走向 的 ， 这 表明 我 们 所 有 的 组 件 都 
会 按 从 上 到 下 的 顺序 排列 。 


微调 按钮 组 件 有 一 个 弱点 ， 它 不 支持 " 步 进 " 功 能 。 在 其 他 3 个 例子 中 ， 我 们 可 以 点 箭头 按钮 让 
控制 组 件 每 次 增加 或 减少 2， 但 对 这 个 组 件 却 不 行 。 


39 ~ 51 行 
我 们 的 应 用 程序 类 实例 化 了 一 个 刚才 设计 的 框架 对 象 ， 把 它 绘制 在 屏幕 上 ， 并 设置 成 程序 的 
顶层 窗口 。 最 后 ， 几 行 安 装 代码 实例 化 了 GUl 应 用 程序 对 象 并 启动 之 。 


19.4.4 GTK+ 和 PyGTK 


最 后 是 PyGTK 版 的 例子 ， 它 和 wxPython GUI 程序 非常 相似 〈 见 例 19. 10) 。 最 大 的 不 同 是 我 
们 只 用 一 个 类 ， 还 有 那些 设置 对 象 一 一 实际 上 就 是 按钮 一 一 前 景 、 背 景色 的 代码 实在 是 很 元 
长 。 
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逐 行 解释 


1-611 


我 们 导入 了 3 个 不 同 的 模块 和 包 ，PyGTK、GTK 和 Pango。Pango 是 一 个 用 来 布局 和 生成 文本 
的 库 ， 专 用 于 实现 |18N。 这 里 需要 这 个 库 是 因为 它 体 现 了 GTK+ (2x) 对 文字 和 字体 处 理 的 


核心 思想 


我 们 最 后 一 个 例子 使 用 PyGTK (和 GTK+ ) 


o 


o 类似 wxPython 的 例子 ， 这 里 对 应 用 程序 也 用 了 


一 个 类 。 对 比 一 下 这 两 个 GUI 程序 例子 的 相似 和 不 同 点 是 很 有 趣 的 。 这 种 现象 并 不 奇怪 ， 它 使 
得 开发 者 可 以 比较 容易 的 转 用 其 他 工具 集 。 


C Js O uU A Ww WM wc 
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$!/usr/bin/env python 


import pygtk 
Pygtk.require('2.0') 
import gtk 

import pango 


class GTKapp(object): 


def — init. (self): 

top * gtk.Window(gtk.WINDOW TOPLEVEL) 
top.connect ("delete event", gtk.main quit) 
top.connect("destroy", gtk.main quit) 

box = gtk.VBox(False, 0) 

lb = gtk.Label( 


'Animals (in pairs; min: pair, max: dozen) "') 


box.pack start (1b) 


sb = gtk.HBox(False, 0) 

adj = gtk.Adjustment(2, 2, 12, 2, 4, 0) 

sl = gtk.Label('Number:"') 

s1.modify font( 
pango.FontDescription("Arial Bold 10")) 

sb.pack start(s1) 

ct = gtk.SpinButton(adj, 0, 0) 

sb.pack start (ct) 


box.pack start (sb) 


cb = gtk.HBox(False, 0) 
c2 = gtk.Label('Type:') 
cb.pack start (c2) 


ce = gtk.combo box entry new text () 


for animal in ('dog', 'cat','hamster', 'python"'"): 


ce.append text (animal) 
Cb.pack, start (ce) 
box.pack, start (cb) 


qb = gtk.Button("") 

red = gtk.gdk.color parse('red"') 
sty = qb.get style() 

for st in (gtk.STATE NORMAL, 
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sty.bg[st r 
qb.set yl ) 
ql qhb ,ch 

t 


47 gtk.Widget.destroy, t 


48 box.pack start (qb) 


8 ~ 15 行 


GTKapp 类 反应 了 本 程序 中 所 有 的 组 件 。 顶 层 窗口 在 这 里 创建 (窗口 管理 器 负责 关闭 它 ) ， 而 
且 还 创建 了 一 个 重 直 走向 的 布局 管理 器 (VBox) 来 掌管 我 们 的 主要 组 件 。 这 些 实际 上 和 我 们 
在 wxPython GUI 程序 中 作 的 一 样 。 


然而 ， 为 了 让 微调 按钮 和 组 合 框 的 静态 文本 能 出 现 它们 的 左 侧 (wxPython 例 子 中 出 现在 上 
方 ) ， 我 们 创建 了 小 型 的 水 平 走向 的 方 框 来 包括 标签 组 件 对 (18 一 36 行 ) ， 而 且 还 把 这 些 
HBox 完 全 置 于 VBox 的 掌控 之 下 。 


接 下 来 我 们 创建 了 退出 按钮 并 把 VBox 添 加 到 顶层 窗口 中 ， 然 后 把 一 切 绘制 到 屏幕 上 。 你 一 定 
注意 到 我 们 刚 开 始 用 空 标题 创建 了 按钮 。 我 们 这 样 做 是 为 了 让 标签 (F) 对 象 能 作为 按钮 的 
一 部 分 被 创建 。 在 45~46 行 ， 我 们 取得 标签 的 访问 权 并 用 白色 字体 设置 了 文字 。 

我 们 这 样 做 的 原因 是 如 果 你 直接 设置 前 景 风格 一 一 通过 41~~44 行 的 循环 和 辅助 代码 一 一 那么 
前 景 只 会 对 按钮 起 作用 而 对 其 他 一 一 例如 标签 一 却 是 无 效 的 ， 假 如 你 把 前 景 设 为 白色 并 把 焦 
点 置 在 按钮 上 (通过 按 TAB 键 可 以 “选中 ” 它 ) ， 你 将 看 到 用 来 标识 选中 组 件 的 内 点 画 线 是 白色 
的 ， 而 标签 文字 却 依然 是 黑色 的 ， 除 非 你 像 我 们 在 第 45 行 ( 译 者 注 : 原文 为 “第 46 行 ”， 应 为 作 
者 笔 误 ) 那样 改 一 下 。 

53 ~ 55 行 


我 们 在 这 里 创建 了 应 用 程序 并 进入 主事 件 循环 。 


19.5 ”相关 模块 和 其 他 GUI 


Python 还 有 一 些 其 他 的 GUI 开发 系统 。 我 们 在 表 19.2 中 列 出 适当 的 模块 及 其 对 应 的 窗口 系统 。 
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A 192 
GUI 模块 或 系统 LEE: 
Tk X LR 








TK INTER(face: Python 的 默认 GUI 工具 集 http://wiki.python.org/moin/TkInter 


Python MegaWidgets (Tkinter 4^ Il 
http://pmw.sf.net n 
Tk Interface eXtension (Tk 扩展 ) 

http://tix.sf.net 


x 
GUI Hb E s x 
Extended Tk canvas type (TK $I) 
TkZinc (Zinc) ra Poma 
Ts on opns GUI. (Tkinter 扩 展 ) 
EasyGU! (easygui) À d 
TIDE + (IDE Stadio) Tix 要 号 开发 环境 (但 括 1DE Smdio， 一 个 Tix MEARE IDLE IDE) htrpcóstarship pvihon.net crew/ mike 
wx Widgets MIEUA 
wxPython Python 对 wxWidgets (4818 , 一 个 中 时 个 的 GUI BURN OVITE A wx Windows? bitp://wxpython.ong 
Boa Constructor Python 11 1 7-32 138 JE wxPython GUI 构造 工具 http://boa-constructor.sf.net 
i 基于 wxPython 的 GUI Al CREPUPT. PRU (0A HyperCard 获得 灵感 ) 
http//pythoncard sf. net 
idit 另 一 个 wxPython GUI 设计 工具 《从 Glade (GTK GNOME 的 GUI 构建 工具 ) 受到 启发 》 
hip;/wxglade.sf.net 
GTK«/GNOME ll X MER 
对 GIMP 工具 入 (GTK+) 的 封装 序 
PyGTK doe 
对 GNOME fili FF XLW OAE ir 
GNOME-Python Python 
htipi//gnome.ory/start/unstable/bindings http-//download. gnome org'soarces'gnome-python 
Glade -个 针对 GTK+ 和 和 GNOME 的 GUI 构建 工具 
hrp://glade gnome org 
PjOUI (QUI) "Pythonic" itp fr GUI PITARINIELI (MacOS X HRF Cocos. POSDUXTI 和 Win2 中 基于 GIK+) 
htp/www.cosc. camterbury-ac-nz/-greg/pythoa gui 
QUKDE 1H Xf 5t 
pa Trolltech 开发 的 Python 对 Qt GUUXML/SQL. 工具 巢 的 柳 定 (友协 议 ， 事 分 开源 ) 
hnp:/riverhankcomputing.co.uk/pyqt 
PyKDE Python X! KDE Ali $838 0)96 A http-//riverhankcomputing co uk/pykde 
- Python ff Hi Qscintilla editar fl fl £837] PyQr 集成 开发 环境 hutp:/idie-offenbachs.de/detlev/eric3 
http;/lericide. python-hosting.com/ 
PyQUPL. 包括 Qt CWin32 Cygwin BAMAR) . Sip. QScintilla 和 PyQt 的 工具 包 Intps/pythonqt.vanrietpaap.nl 
IAF GUI LILA 











Python 对 FOX T JUR O88. Chttp:/fox-toolkit.ong) 
hitp-//fxpy.sf.net. 
Python 14 FLTK 工具 向 的 娃 定 Chnp-/fik org? 
http-/ipyfltk.«f net 
Python JJ OpenGL HWE Cnttp://opengl.org? 
hitp;//pyopengl.sf.net 
















Python Mi Microsoft MFC (MF Python 的 Windows 4^ BE) 
htzp-/óstarship. python. net/crew/mhammond/win32 
Python Bf) Sun Microsystems Java/Swing 【基于 Jython) 
http: python org 







你 还 能 从 Python 的 GUI 编程 简介 wiki 页 面 http:/Wwiki.python.org/moin/GuiProgramming 上 找到 


更 多 有 关 Python GUI 编程 的 东西 。 
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19.6 练习 


19-1. 客 户 端 /服务 器 架构 。 请 描述 窗口 服务 器 的 角色 和 窗口 客户 端的 角色 。 
19-2. 面 向 对 象 编程 。 请 描述 子 窗口 和 父 窗口 的 关系 。 
19-3. 标 签 组 件 。 请 修改 tkhellol.py 脚 本 ， 让 它 显示 你 自 定义 的 消息 而 非 “Hello World" 


19-4. 标 签 和 按钮 组 件 。 请 修改 tkhello3.py 脚 本 ， 除 了 QUIT 按 钮 以 外 再 新 增 3 个 按钮 。 按 
下 这 3 个 按钮 中 的 任意 一 个 都 将 改变 标签 文字 ， 显 示 被 按 下 的 按钮 (组件) 上 的 文字 。 


19-5. 标 签 、 按 钮 和 单 选 按钮 组 件 。 请 对 你 上 一 问题 的 答案 作 人 和 修改， 用 3 个 单 选 按钮 实现 
对 标签 文字 的 选择 。 现 在 有 两 个 按钮 : QUIT 按 钮 和 "更 新 "按钮 。 当 更 新 按钮 被 按 下 时 ， 
标签 里 的 文字 变 成 选中 的 单项 按钮 上 的 文字 。 如 果 没 有 选中 任何 单 选 按钮 ， 则 标签 内 容 
保持 不 变 。 


19-6. 标 签 、 按 钮 和 文本 框 组 件 。 请 对 你 上 一 问题 的 答案 作 修改 ， 用 一 个 单行 的 文本 框 组 
件 蔡 换 那 3 个 单 选 按钮 ， 文 本 框 的 默认 值 为 "Hello World! ”( 和 标签 的 初始 字符 囊 保持 一 
EO) 。 用 户 可 以 编辑 文本 框 ， 输 入 新 的 字符 囊 ， 标 签 组 件 会 在 更 新 按钮 被 按 下 时 显示 这 
个 新 的 字符 囊 。 


19-7. 标 签 、 文 本 框 组 件 及 Python MO。 创 建 包 含 一 个 文本 框 的 GUI 程序 ， 用 户 可 以 在 其 中 
输入 一 个 文本 文件 名 。 打 开 该 文件 并 读 取 ， 把 其 中 的 内 容 显 示 在 标签 组 件 上 。 附 加 题 
(菜单 ) : 把 文本 框 换 成 一 个 包含 文件 打开 选项 的 菜单 ， 它 会 弹出 一 个 窗口 供用 户 选 择 
要 读 取 的 文件 。 再 给 菜单 加 上 一 个 Exit 或 Quit 选 项 ， 这 样 就 用 不 着 QUIT 按 钮 了 。 


19-8. 简 单 的 文本 编辑 器 。 在 你 上 一 题 答案 的 基础 上 创建 一 个 简单 的 文本 编辑 器 。 可 以 用 
剪贴 板 或 读 文件 的 方式 在 一 个 文本 域 里 显示 一 些 文字 供用 户 编辑 。 当 用 户 退 出 程序 时 
(通过 QUIT 按 钮 或 Quit/Exit 菜 单项 ) 会 询问 用 户 是 否 保存 所 作 的 修改 。 附 加 题 : 给 你 的 
脚本 添加 一 个 拼写 检查 接口 ， 增 加 一 个 按钮 或 菜单 项 来 对 文件 进行 拼写 检查 。 拼 写 错误 
的 词句 应 在 文本 域 组 件 中 用 不 同 的 背景 或 前 景色 高 亮 显示 出 来 。 


19-9. 多 线程 聊天 应 用 程序 。 第 13、16、17 章 讲 到 的 聊天 程序 可 以 完成 了 。 创 建 一 个 全 功 
能 的 多 线程 聊天 服务 器 。 这 个 服务 器 其 实 并 不 需要 有 GUI， 除 非 你 想 给 它 创 建 一 个 前 端 配 
置 界 面 ， 配 置 端 口号 、 名 称 、 到 域名 服务 器 的 连接 等 。 创 建 一 个 多 线程 的 聊天 客户 端 ， 

使 用 单独 的 线程 监视 用 户 输 入 (并 以 广播 方式 给 服务 器 发 送 消息 ) ， 另 一 个 线程 用 来 接 
收 消息 并 显示 给 用 户 。 客 户 端 的 GUI 聊 天 窗口 应 当 由 两 部 分 组 成 : 较 大 的 部 分 用 来 多 行星 
示 所 有 的 对 话 ， 较 小 的 文本 域 用 来 接收 用 户 输入 。 


19-10. 使 用 其 他 GUI。19. 4 中 的 例子 使 用 到 了 各 种 各 样 的 工具 集 ， 这 些 GUI 程 序 看 起 来 很 
相似 ; 然而 ， 它 们 并 不 完全 一 样 。 尽 管 不 可 能 让 所 有 的 例子 看 起 来 完全 一 样 ， 但 请 尽量 
调整 它们 ， 让 它们 比 现在 看 起 来 更 一 致 些 。 
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19-11. 使 用 GUI 构建 工具 。 下 载 Boa Constructor (wxWidgets 平 台 ) 或 Glade (GTK+ 平 
台 ) 《或 者 都 下 载 ) ， 然 后 实现 那个 “动物 ”GUI 程序 ， 只 用 从 相应 的 工具 栏 拖 旭 一 些 组 件 
就 好 了 。 给 你 的 新 GUI 加 上 回调 函数 ， 让 它 能 有 本 章 例 子 程序 中 的 那些 行为 。 
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20.1 介绍 


I ETE ， Hae tud. 因特网 上 的 各 种 基础 应 用 有 个 概要 了 
解 ， 例 如 通过 VWeb 页 面 建立 用 户 反 馈 表 单 ， 通 过 CGI 动态 生成 输出 页 面 。 


20.1.4 Web 应 用 : 客户 端 /服务 器 计算 


Veb 应 用 遵循 我 们 反复 提 到 的 客户 端 /服务 器 架构 。 这 里 ，VWeb 的 客户 端 是 浏览 器 ， 
允许 用 户 在 万 维 网 上 查询 文档 。 另 外 Web 服 务 器 端 进程 运行 在 信息 提供 商 的 主机 上 。 这 些 
服务 器 等 待 客户 和 文档 请 求 ， 进 行 相应 的 处 理 ， 返 回 相 关 的 数据 。 正 如 大 多 数 客户 端 /服务 器 
的 服务 器 端 一 样 ，Web 服 务 器 端 被 设置 为 “永远 "运行 。 图 20-1 列 举 了 Web 应 用 的 体验 。 这 里 ， 
一 个 用 户 执行 一 个 像 浏 览 器 的 这 类 客户 端 程序 与 Web 服 务 器 取得 连接 ， 就 可 以 在 因特网 上 任 
何 地 方 获得 数据 。 


f The Internet 


zf Client 





图 20-1 因特网 上 的 Web 窜 户 端 和 和 Web 服务器 。 在 因特网 上 客户 端 向 服务 器 端 发 送 一 个 
请 求 ， 然 后 服务 器 端 响应 这 个 请 求 并 将 相应 的 数据 返回 给 客户 端 


客户 端 可 能 向 服务 器 端 发 出 各 种 请 求 。 这 些 请 求 可 能 包括 获得 一 个 网 页 视图 或 者 提交 一 个 包 
含 数据 的 表单 。 这 个 请 求 经 过 服务 器 端的 处 理 ， 然 后 会 以 特定 的 格式 (HTML 等 ) 返回 给 客户 


端 浏览 。 


Web 客 户 端 和 服务 器 端 交 互 使 用 的 “语言 "， Web 交互 的 标准 协议 是 HTTP ( 超 文本 传输 协议 ) 。 
HTTP 协 议 是 TCP/IP 协 议 的 上 层 协 议 ， 这 意味 着 HTTP 协 议 依靠 TCP/IP 协 议 来 进行 低层 的 交流 
工作 。 它 的 职责 不 是 路 由 或 者 传递 消息 (TCPJIP 协 议 处 理 这 些 ) ， 而 是 通过 发 送 、 接 收 HTTP 
消息 来 处 理 客户 端的 请 求 。 


HTTP 协 议 属于 无 状态 协议 ， 它 不 跟踪 从 一 个 客户 端 到 另 一 个 客户 端的 请 求 信 息 ， 这 点 和 我 们 
现今 使 用 的 客户 端 /服务 器 端 架构 很 像 。 服 务 器 端 持续 运行 ， 但 是 客户 端的 活动 是 按照 这 种 结 
构 独 立 进 行 的 : 一 旦 一 个 客户 的 请 求 完成 后 ， 活 动 将 被 终止 。 可 以 随时 发 送 新 的 请 求 ， 但 是 
他 们 会 被 处 理 成 独立 的 服务 请 求 。 由 于 每 个 请 求 缺 乏 上 下 文 背 景 ， 你 可 以 注意 到 有 些 URL 会 
有 很 长 的 变量 和 值 作 为 请 求 的 一 部 分 ， 以 便 提 供 一 些 状态 信息 。 另 外 一 个 选项 是 "cookie" — 
保存 在 客户 端的 客户 状态 信息 。 在 本 章 的 后 面部 分 ， 我 们 将 会 看 到 如 何 使 用 URL 和 cookie 来 保 
存 状态 信息 。 


20.1.2 特 网 


因特网 是 一 个 连接 全 球 客户 端 和 服务 器 端的 变幻 英 测 的 "迷雾"*。 客户 端 最 终 连接 到 服务 器 的 通 
路 ， 实 际 包含 了 不 定 节点 的 连通 。 作 为 一 个 客户 端 用 户 ， 所 有 这 些 实现 细节 都 会 被 隐藏 起 
来 。 抽 象 成 为 了 从 客户 端 到 所 访问 的 服务 器 端的 直接 连接 。 被 隐藏 起 来 的 HTTP, TCP/IP 协 议 
将 会 处 理 所 有 的 繁重 工作 。 中 间 的 环节 信息 用 户 并 不 关心 ， 所 以 将 这 些 执行 过 程 隐 藏 起 来 是 
有 好 处 的 。 图 20-2 展 示 了 因特网 的 扩展 视图 。 

如 图 20-2 所 示 ， 因 特 网 是 由 多 种 工作 在 一 定 规则 下 的 (也许 非 


的 。 图 表 左 侧 的 焦点 是 Web 客 户 端 ， 在 家 上 网 的 用 户 通过 拨号 
上 ， 上 班 族 使 用 的 则 是 公司 的 局 域 网 。 


贯 的 ) 相互 连接 的 网 络 组 成 


连 
连接 到 ISP (因特网 供应 商 ) 


图 表 的 右 半 部 分 关注 的 是 Web 服 务 器 端 及 位 置 所 在 。 具 有 大 型 Web 站 点 的 公司 会 将 他 们 全 部 
的 "Web 服务 器 ” 放 在 ISP 那 里 。 这 种 物理 安放 被 称 为 “整合 "， 这 意味 着 你 的 服务 器 和 其 他 客户 
的 服务 器 一 同 放 在 ISP 处 被 “集中 管理 "。 这 些 服务 器 或 许 为 客户 提供 了 不 同 的 数据 或 者 有 一 部 
分 为 应 付 重 负荷 (高 数量 用 户 群 ) 而 设计 成 了 可 以 存储 重复 数据 的 系统 。 小 公司 的 Web 站 点 
或 许 不 需要 这 么 大 的 硬盘 或 者 网 络 设备 ， 也 许 仅 有 一 个 或 者 几 个 "整合 "服务 器 安放 在 他 们 的 
ISP 处 就 可 以 了 。 

在 任何 一 种 情况 下 ， 大 多 数 "整合 "服务 器 被 部 署 在 大 型 ISP 提 供 的 骨干 网 上 ， 这 意味 着 他 们 具 
有 更 高 的 "带宽 ”， 如 果 你 愿意 ， 可 以 更 接近 因特网 的 核心 点 ， 从 而 可 以 更 快 地 与 因特网 取得 连 
接 。 这 就 允许 客户 端 可 以 绕 过 许多 网 络 直接 快速 的 访问 服务 器 ， 从 而 在 指定 的 时 间 内 可 以 使 
得 更 多 的 客户 获得 服务 。 
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20-2 因特网 的 统 览 。 左 侧 指 明了 在 哪里 你 可 以 找到 Web 客 户 端 而 右 侧 则 暗示 了 
Web 服 务 器 的 具体 位 置 


有 一 点 需要 记 清楚 ，Web 应 用 是 网 络 应 用 的 一 种 最 普遍 的 形式 ， 但 不 是 唯一 的 也 不 是 最 古老 
的 一 种 形式 。 因 特 网 的 出 现 早 于 Web 近 30 年 。 在 Web 出 现 之 前 ， 因 特 网 主要 用 于 教学 和 科研 
目的 。 因 特 网 上 的 大 多 数 系统 都 是 运行 在 Unix 平 台 上 的 一 一 一 个 多 用 户 操 作 系 统 ， 许 多 最 初 
的 网 际 协议 至 今 仍 被 沿用 。 

这 些 协议 包括 telnet (允许 用 户 在 因特网 上 登录 到 远程 的 主机 上 ， 沿 用 至 今 ) , FTP 协议 (文本 


传输 协议 ， 用 户 通过 上 传 和 下 载 文 件 可 以 共享 文件 和 数据 ， 沿 用 至 今 ) , Gopher. (Webit € 
引擎 的 维 形 一 个 在 互联 网 上 卜 动 的 小 软件 "gopher 可 以 自动 寻找 你 感 兴趣 的 数据 ) ， 





SMTP 或 者 叫做 简单 邮件 传输 协议 (这 个 协议 用 于 最 古老 的 也 是 应 用 最 广泛 的 电子 邮件 ) ， 
NNTP (新 闻 对 新 闻 传 输 协 议 ) 。 


由 于 Python 的 最 初 偏重 的 就 是 因特网 编程 ， 除 了 其 他 一 些 东西 外 你 还 可 以 找到 上 边 提 及 的 所 
有 协议 。 可 以 这 样 区 分 “因特网 编程 "和 “Web 编 程 ”， 后 者 仅 包 括 针 对 Web 的 应 用 程序 开发 ， 也 
就 是 说 Web 客 户 端 和 服务 器 是 本 章 的 焦点 。 


因特网 编程 涵盖 更 多 范围 的 应 用 程序 : 包括 我 们 之 前 提 及 的 一 些 网 际 协 议 ， 例 如 FTP、SMTP 
等 ， 同 时 也 包括 我 们 前 一 章 提 到 的 网 络 编程 和 套 接 字 编 程 。 


20.2 ”使 用 Python 进行 Web 应 用 : 创建 一 个 简单 的 
Web 和 客户 端 


Ol 楚 ， 浏 览 器 只 是 Web 客 户 端的 一 种 。 任 何 一 个 通过 向 服务 器 端 发 送 请 求 来 获 
得 数据 的 应 用 程序 都 被 认为 是 “客户 端 "'。 当然， 也 可 以 建立 其 他 的 客户 端 从 而 在 因特网 上 检索 
出 文档 和 数据 。 这 样 做 的 一 个 重要 原因 就 是 浏览 器 的 能 力 有 限 ， 也 就 是 说 ， 它 主要 用 于 查看 
并 同 其 他 Web 站 点 交互 。 另 一 方面 ， 一 个 客户 端 程序 ， 有 能 力 做 得 更 多 一 一 它 不 仅 可 以 下 载 
数据 ， 同 时 也 可 以 存储 、 操 作 数据 ， 甚 至 或 可 以 将 其 传送 到 另外 一 个 地 方 或 者 传 给 另外 一 个 
应 用 。 


一 个 使 用 urllib 模 块 下 载 或 者 访问 Web 上 的 信息 的 应 用 程序 [使 用 urllib. urlopen() 或 者 urllib. 
urlre-trieve()] 可 以 被 认为 是 简单 的 Web 客 户 端 。 你 所 要 做 的 就 是 提供 一 个 有 效 的 Web 地 址 。 


20.2.1 统一 资源 定位 符 


简 eps 用 包括 使 用 被 称 为 URL (统一 资源 定位 器 ，Uniform Resource Locator) 的 Web 
地 址 。 这 个 地 址 用 来 在 Web 上 定位 一 个 文档 ， 或 者 调用 一 个 CGI| 程 序 来 为 你 的 客户 端 产 生 一 个 
文档 。URL 是 大 型 标识 符 URI (统一 资源 标识 ，Uniform Resource Identifier) 的 一 部 分 。 这 个 
超 集 是 建立 在 已 有 的 命名 惯例 基础 上 的 。 一 个 URL 是 一 个 简单 的 URI， 使 用 已 存在 的 协议 或 规 
X| (也 就 是 http, ftp) 作为 地 址 的 一 部 分 。 为 了 进一步 描绘 这 些 ， 我 们 将 会 引入 非 URL 的 
URI， 有 时 这 些 被 成 为 URN (统一 资源 名 称 ，Uniform Resource Name) ， 但 是 在 今天 我 们 唯 
一 使 用 的 一 种 URI 是 URL， 至 于 URI 和 URN 你 也 许 没 有 听 到 太 多 ， 这 或 许 已 被 保存 成 XML 标识 
符 了 。 


如 街道 地 址 一 样 ，Web 地 址 也 有 一 些 结构 。 美 国 的 街道 地 址 通常 是 这 种 格式 "号码 街 道 名 称 ”， 
例如 “123 主 大 街 ”。 这 个 和 其 他 国家 不 同 ， 他们 有 自己 的 规则 。URL 使 用 这 种 格式 : 


prot sch://net loc/path;params?queryféfrag 


表 20.1 描 述 了 各 个 部 件 。 


X 20.1 Web 地 址 元 素 
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net loc 可 以 进一步 拆 分 成 多 个 部 件 ， 有些 是 必 备 的 ， 其 他 的 是 可 选 部 件 ，net loc 字 符 串 如 
"T: 


user:passwdQhost:port 


表 20.2 中 分 别 描述 了 这 些 部 件 
X 20.2 网 络 定位 元 素 
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在 这 4 个 部 件 中 ，host 主 机 名 是 最 重要 的 。 端 口号 只 有 在 Web 服 务 器 运行 其 他 非 默 认 端 口上 时 
才 会 被 使 用 (如 果 你 不 确定 所 使 用 的 端口 号 ， 可 以 参考 第 16 章 ) 。 


用 户 名 和 密码 部 分 只 有 在 使 用 FTP 连 接 时 候 才 有 可 能 用 到 ， 因 为 即使 是 使 用 FTP， 大 多 数 的 连 
接 都 是 使 用 “匿名 "这 时 是 不 需要 用 户 名 和 密码 的 。 


Python 支持 两 种 不 同 的 模块 ， 分 别 以 不 同 的 功能 和 兼容 性 来 处 理 URL。 一 种 是 urlparse， 另 一 
种 是 urllib。 这 里 我 们 将 会 简单 的 介绍 下 它们 的 功能 。 


20.2.2 urlparse 模 块 


urlpasrse 模 块 提供 了 操作 URL 字 符 串 的 基本 功能 。 这 些 功能 包括 urlparse()、urlunparse() 和 


urljoin(). 


urlparse.urlparse () 


urlparse() 将 URL 字 符 串 拆 分 成 如 上 所 描述 的 一 些 主要 部 件 。 语 法 结构 如 下 : 


lo ` bo £r A 二 了 一 
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urlparse (urlstr, defProtSch-None, allowFrag=None) 


urlparse() 将 Urlstr 解 析 成 一 个 6 元 组 (prot sch ^ net loc ^ path ^ params ` query ^ frag) ° 
这 里 的 每 个 部 件 在 上 边 已 经 描述 过 了 。 如 果 Urlstr 中 没有 提供 默认 的 网 络 协 议 或 下 载 规划 时 可 
以 使 用 defProtSch。allowFrag 标 识 一 个 URL 是 否 允 许 使 用 零 部 件 。 下 边 是 一 个 给 定 URL 经 
urlparse() 后 的 输出 : 


»»»urlparse.urlparse('http://www.python.org/doc/FAQ.html') 
('http', 'www.python.org', '/doc/FAQ.html', '', '', Te} 


urlparse.urlunparse() 


urlunparse() 的 功能 与 urlpase() 完 全 相反 : 它 拼合 一 个 6 元 组 (prot sch » net loc ` path ^ 
params ` query ` frag) -urltup， 它 可 能 是 一 个 URL 经 urlparse() 后 的 输出 返回 值 。 于 是 ， 我 
们 可 以 用 如 下 方式 表示 : 


urlunparse(urlparse(urlstr)) =  urlstr 


你 或 许 已 经 猜 到 了 urlunpase() 的 语法 


urlunparse(urltup) 


urlparse.urljoin() 


在 需要 多 个 相关 的 URL 时 我 们 就 需要 使 用 urljoin() 的 功能 了 ， 如 在 一 个 Web 页 中 生成 的 一 系列 
页 面 的 URL。Urljoin() 的 语法 是 : 


urljoin(baseurl, newurl, allowFrag-None) 


3 20.3 urlparse 模块 核心 函数 






urlparse 功能 


将 urlstr 解析 成 各 个 部 件 ， 如 果 在 mulstr 中 没有 给 定 协议 或者 规划 格 使 用 
defProtSch,. allowFrag 次 定 是 否 区 许 有 URL SERM 


将 URL 数 扫 (urkwp) 的 一 个 元 姐 反 解 析 成 一 个 URL FR 






urlparse( uristr, defProtiSch -Nonec.allowFrag-None) 





urlunparse(urirup) 





将 URL 的 基部 御 baseurl 和 newurl 拼合 成 一 个 完整 的 URLs. allowFrag 的 


urljoin( basewrl, mewwrl, allowFrag *Nonc) 作用 和 uri ) 中 相同 





urljoin() 取 得 baseurl， 并 将 其 基 路 径 (net_loc 附 加 一 个 完整 的 路 径 ， 但 是 不 包括 终端 的 文件 ) 
与 Newurl 连 接 起 来 。 例 如 : 


>>> urlparse.urljoin('http://www.python.org/doc/FAQ.html', \ 


'current/lib/lib.htm') 


'http://www.python.org/doc/current/lib/lib.html' 
, 


在 表 20.3 中 可 以 找到 Urlparse 的 功能 概述 。 
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20.2.3 ”urllib 模 块 





核心 模块 : urllib 


urllib 模 块 提供 了 所 有 你 需要 的 功能 ， 除 非 你 计划 写 一 个 更 加 低层 的 网 络 客 户 端 ?urllib 提 供 了 
一 个 高 级 的 Web 交 流 库 ， 支 持 Web 协 议 、HTTP、FTP 和 Gopher 协 议 ， 同 时 也 支持 对 本 地 文件 
的 访问 。urllib 模 块 的 特殊 功能 是 利用 上 述 协 议 下 载 数据 (从 因特网 、 局 域 网 、 主 机 上 下 

R) 。 使 用 这 个 模块 可 以 避免 使 用 httplib、ftplib 和 gopherlib 这 些 模块 ， 除 非 你 想 用 更 低层 的 功 
能 。 在 那些 情况 下 这 些 模块 都 是 可 选择 的 (注意 : 大 多 数 以 二 jb 命名 的 模块 用 于 客户 端 相关 协 
议 开 发 。 并 不 是 所 有 情况 都 是 这 样 的 ， 或 许 urllib 应 该 被 命名 为 “internetlib” 或 其 他 相似 的 名 
RULES 


Urllib 模 块 提供 了 在 给 定 的 URL 地 址 下 载 数 据 的 功能 ， 同 时 也 可 以 通过 字符 串 的 编码 、 解 码 来 
确保 它们 是 有 效 URL 字 符 串 的 一 部 分 。 我 们 接 下 来 要 谈 的 功能 包括 urlopen()、urlretrieve() ^ 

quote() ^ unquote() 、quote_plus()、unquote_plus() 和 urlencode()。 我 们 可 以 使 用 urlopen() 
方法 返回 文件 类 型 对 象 。 你 会 觉得 这 些 方法 不 陌生 ， 因 为 在 第 9 章 我 们 已 经 涉及 到 了 文件 方面 
的 内 容 。 


1. urllib. urlopen() 


urlopen() 打 开 一 个 给 定 URL 字 符 串 与 Web 连 接 ， 并 返回 了 文件 类 的 对 象 。 语 法 结构 如 下 : 


urlopen(urlstr, postQueryData-None) 


urlopen() 打 开 urlstr 所 指向 的 URL。 如 果 没 有 给 定 协 议 或 者 下 载 规划 ， 或 者 文件 规划 早已 传 
入 ，urlopen() 则 会 打开 一 个 本 地 的 文件 。 


对 于 所 有 的 HTTP 请 求 ， 常 见 的 请 求 类 型 是 -GET”。 在 这 些 情况 中 ， 向 Web 服 务 器 发 送 的 请 求 
字符 串 (编码 键 值 或 引用 ， 如 urlencode() 驾 数 的 字符 串 输 出 (如 下 ) ) 应 该 是 urlstr 的 一 部 


分 。 


如 果 要 求 使 用 "POST" 方 法 ， 请 求 的 字符 串 (编码 的 ) 应 该 被 放 到 postQueryData 交 量 中 。 
(要 了 解 更 多 关于 “GET"” 和 ”POST" 方 法 的 信息 ， 请 查看 CGI 应 用 编程 部 分 的 普通 文档 或 者 文 
本 ， 这 些 我 们 在 下 边 也 会 讨论 ) 。GET 和 POST 请 求 是 向 Web 服 务 器 上 传 数据 的 两 种 方法 。 


连接 成 功 ，urlopen() 将 会 返回 一 个 文件 类 型 对 象 ， 就 像 在 目标 路 径 下 打开 了 一 个 可 读 文 
件 。 NT KRRIT” ARA AIT" 6148 E CREER AE ^ tof. read() ^ f. 
readline() ` f. readlines() ^ f.close()7ef.fileno() ° 


此 外 ，f.info() 方 法 可 以 返回 MIME (多 目标 因特网 邮件 扩展 ，Multipurpose Internet Mail 

Extension) 头 文件 。 这 个 头 文件 通知 浏览 器 返回 的 文件 类 型 可 以 用 哪 类 应 用 程序 打开 。 例 

如 ， 浏 览 器 本 身 可 以 查看 HTML ( 超 文 本 标记 语言 ，HyperText Markup Language) ， 纯 文本 
文件 ， 生 成 〈 指 由 数据 显示 图 像 一 译 者 注 ) PNG (Portable Network Graohics) ` JPEG 
(Joint Photographic Experts Group) 或 者 GIF 〈Graphicslnterchange Format) 文件 。 其 他 

如 多 媒体 文件 、 特 殊 类 型 文件 需要 通过 扩展 的 应 用 程序 才能 打开 。 


最 后 ，geturl() 方 法 在 考虑 了 所 有 可 能 发 生 的 间接 导向 后 ， 从 最 终 打 开 的 文件 中 获得 丨 实 的 
URL， 这 些 文件 类 型 对 象 的 方法 在 表 20.4 中 有 描述 。 


表 20.4 Urlib. Urlopen() 





urlopen( 对象 方 芒 [E 
f.read( | bytes]) | JA, f "PETERE F3 bytes 1 
f.readlinet ) Ar 
f. readlinesi ) 从 竹 中 该 


f.choset) GRI f£ tr) URL (rtt 








f fien) HE (HS RM 
finfoQ 发 得 上 的 MIME XX ft 


f geturi) 运河 人 所 打开 人 的 真正 的 URI 


如 果 你 打算 访问 更 加 复杂 的 URL 或 者 想 要 处 理 更 复杂 的 情况 ， 如 基于 数字 的 权限 验证 、 重 定 
位 、cookie 等 问题 ， 我 们 建议 你 使 用 urllib2 模 块 ， 这 个 在 1. 6 版 本 中 有 介绍 (多 数 是 试验 模 
3k) 。 它 同时 还 有 一 个 urlopen() 函 数 ， 但 也 提供 了 其 他 的 可 以 打开 各 种 URL 的 函数 和 类 。 关 
于 urllib2 的 更 多 信息 ， 将 会 在 本 章 的 下 一 部 分 介绍 。 


2. urllib.urlretrieve() 
如 果 你 对 整个 URL 文 档 的 工作 感 兴 趣 ，urlretrieve() 可 以 帮 你 快速 处 理 一 些 繁重 的 工作 。 下 面 
是 urlretrieve() 的 语法 : 
urlretrieve (urlstr, localfilesNone, downloadSta tusHook-None) 
除了 像 urlopen() 这 样 从 URL 中 读 取 内 容 ，urlretrieve() 可 以 方便 地 将 urlstr 定 位 到 的 整个 HTML 


文件 下 载 到 你 本 地 的 硬盘 上 。 你 可 以 将 下 载 后 的 数据 存 成 一 个 本 地 文件 或 者 一 个 临时 文件 。 
如 果 该 文件 已 经 被 复制 到 本 地 或 者 已 经 是 一 个 本 地 文件 ， 后 续 的 下 载 动作 将 不 会 发 生 。 


如 果 可 能 ，downloadStatusHook 这 个 函数 将 会 在 每 块 数据 下 载 或 传输 完成 后 被 调用 。 调 用 时 
使 用 下 边 三 个 参数 : 目前 读 入 的 块 数 、 块 的 字 节 数 和 文件 的 总 字 节 数 。 如 果 你 正在 用 文本 或 
图 表 向 用 户 演示 下载 状 态 " 信 息 ， 这 个 函数 将 会 是 非常 有 用 的 。 


Urlretrieve() 返 回 一 个 2 元 组 ， (filename, mime hdrs) .filename 是 包含 下 载 数据 的 本 地 文件 
名 ，mime_hdrs 是 对 Web 服 务 器 响应 后 返回 的 一 系列 MIME 文 件 头 。 要 获得 更 多 的 信息 ， 可 以 
看 mimetools 的 Message 类 。 对 本 地 文件 来 说 mime_hdrs 是 空 的 。 


关于 urlretrieve() 的 简单 应 用 ， 可 以 看 11.4 (grabweb.py) 中 的 例子 。 在 本 章 的 20. 2 小 节 中 将 
会 介绍 urlretrieve() 更 深层 的 应 用 。 


3. Urllib.quote()?eurllib.quote-plus() 


quote*() 函 数 获取 URL 数 据 ， 并 将 其 编码 ， 从 而 适用 于 URL 字 符 串 中 。 尤 其 是 一 些 不 能 被 打印 
的 或 者 不 被 Web 服 务 器 作为 有 效 URL 接 收 的 特殊 字符 串 必 须 被 转换 。 这 就 是 quote*() 函 数 的 功 
能 。quote*() 函 数 的 语法 如 下 : 


quote(urldata, safe-'/') 


过 号 、 下 划 线 、 多 点 、 斜 线 和 字母 数字 这 类 符号 是 不 需要 转化 的 。 其 他 的 则 均 需 要 转换 。 另 
外 ， 那 些 不 被 允许 的 字符 前 边 会 被 加 上 百 分 号 (%) 同时 转换 成 16 进 制 ， 例 如 : "9oxx", 
“XX” 代 表 这 个 字母 的 ASCIIl 码 的 十 六 进 制 值 。 当 调用 quote*() 时 ，urldata 字 符 串 被 转换 成 了 一 
个 可 在 URL 字 符 串 中 使 用 的 等 价值 。safe 字 符 串 可 以 包含 一 系列 不 能 被 转换 的 字符 。 上 默认 的 是 
FFA O). 


Atep AUCE 另外 它 还 可 以 将 空格 编码 成 (+) 号。 下边 是 一 个 使 用 quote() 和 
quote_plus() 的 例子 


>>> name = 'joe mama' 

>>> number = 6 

>>> base 'http://www/--foo/cgi-bin/s.py' 

>>> final = '$s?name-$s&num-$d' $ (base, name, number) 


>>> final 


'http: //www/-7-foo/cgi-bin/s.py?name-joe mama&num-6' 


»»» urllib.quote(final) 
'http: $3a//www/*7efoo/cgi-bin/s.py$3fname$3djoe$20mama$26num$3d6' 
g 


>>> urllib.quote_plus (final) 
'http$3a//www/%7efoo/cgi-bin/ 


s.pyś3fname%3djoetmama%26num%3d6' 
4. urllib.unquote()Zeurllib.unquote plus() 


A8, TES M48 8| 0 — Až > unquote*():& žk 5 quote*() 2 žr 65 zj $6 so 4-48 RC — — 它 将 所 有 编码 
为 “%xx” 式 的 字母 都 转换 成 它们 的 ASCII 码 值 。Unquote*() 的 语法 如 下 : 


unquote* (urldata) 


调用 unquote() 亟 数 将 会 把 urldata 中 所 有 的 URL- 编 码 字 母 都 解码 ， 并 返回 字符 囊 。 
Unquote_plus() 罗 数 会 将 加 号 转换 成 空格 符 。 


5. urllib. urlencode() 


4&1. 5. 2 版 的 Python 中 ，urlopen() 有 函数 接收 字典 的 键 - 值 对 ， 并 将 其 编译 成 CGI 请 求 的 URL 字 
符 串 的 一 部 分 。 键 值 对 的 格式 是 “ 键 = 值 "， 以 连接 符 (&) 划分 。 更 进一步 ， 键 和 它们 的 值 被 传 
到 quote_plus() 函 数 中 进行 适当 的 编码 。 下 边 是 urlencode() 输 出 的 一 个 例子 : 


>>> aDict = ( 'name': 'Georgina Garcia', 'hmdir': '--ggarcia' ) 
>>> urllib.urlencode (aDict) 


'name-Georgina*Garcia&hmdir-$7eggarcia' 


urllib 和 urlparse 还 有 一 些 其 他 的 功能 ， 在 这 里 我 们 就 不 一 一 概述 了 。 阅 读 相 关 文档 可 以 获得 更 
多 信和 自 
乡 信息 。 


6. 安 全 套 接 字 层 支持 


在 1. 6 版 中 urllib 模 块 通过 安全 套 接 字 层 (Secure Socket Layer, SSL) 支持 开放 的 HTTP 连 接 
socket 模 块 的 核心 变化 是 增加 并 实现 了 SSL。 随 后 ，urllib 和 httplib 模 块 被 上 传 用 于 支持 URL 
在 “https” 连 接 规划 中 的 应 用 。 除 了 那 两 个 模块 以 外 ， 其 他 的 含有 SSL 的 模块 还 有 imaplib ` 
poplib 和 smtplib. 


在 表 20.5 中 可 以 看 到 关于 本 节 讨 论 的 urllib 哆 数 的 总 结 。 


表 20.5 核心 urllib 模块 函数 


urilib 基数 Ih 述 





urlopen(urlstr, port Querys Data None) | 打开 URL uristr, 如果 必要 出 通过 postQuery Data 发 送 请 求 











将 URL uristr 定位 的 文件 下 载 到 localfile 248 X fF C5 localfile 没有 综 定 对 ) ; 如 
RIPETE downloaStatusHook H A 1849 F 09 ip OIL 


urlretrieveturlstr, local- file None, 
downloadStatusHook-Nonc) 








quote(urldara, safe-*^) 将 urldata 的 充 效 的 URL FAF): (€ safe 列 的 则 不 名 贸 胡 


4 —!T 





quote plus(uridata, saje) Bx CO 号 《并 等 %20) 外 ， 其 他 功能 与 quote(fB & 
——HÓ— e — À—seiá— rcl as D 
unquote( urldata) ffs uridata ' té Gor RW VI 





- 








unquote plus(urldata) le p 96109 4 Ma rs We AG 1C 19 fe 3 unquote( Ml fd 





urlencodet dier) 将 学 典 健 - 值 对 编译 成 有 效 的 CGI 请 求 字符 市 , 用 quote puoti GbR 72 52) 9L 


20.2.4 ”urllib 模 块 


正如 前 面 所 提 到 的 ，urllib2 可 以 处 理 更 复杂 URL 的 打开 问题 。 一 个 例子 就 是 有 基本 认证 (登录 
名 和 密码 ) 需求 的 Web 站 点 。 最 简单 的 “获得 已 验证 参数 "的 方法 是 使 用 前 边 章节 中 描述 的 URL 
部 件 net loc, 也 就 是 说 : http://user:passwd@www.python.org。 这 种 解决 方案 的 问题 是 不 具有 
可 编程 性 的 。 然 而 使 用 urllib2， 我 们 可 以 通过 两 种 不 同 的 方式 来 解决 这 个 问题 。 


我 们 可 以 建立 一 个 基础 认证 处 理 器 (urllib2. HTTPBasicAuthHandler) ， 同 时 在 基本 URL 或 域 
上 注册 一 个 登录 密码 ， 这 就 意味 着 我 们 在 Web 站 点 上 定义 了 个 安全 区 域 。 (关于 域 的 更 多 信 
息 可 以 查看 RFC2617 (HTTP 认 证 : 基本 数字 认证 ) ) 。 一 旦 完成 这 些 ， 你 可 以 安装 URL 打 
开 器 ， 通 过 这 个 处 理 器 打开 所 有 的 URL。 


另 一 个 可 选 的 办 法 就 是 当 浏 览 器 提示 的 时 候 ， 输 入 用 户 名 和 密码 ， 这 样 就 发 送 了 一 个 带 有 适 
当 用 户 请 求 的 认证 头 。 在 20.1 的 例子 中 ， 我 们 可 以 很 容易 的 区 分 出 这 两 种 方法 。 
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1~7 行 


普通 的 初始 化 


9~15 行 


代码 的 “handler" 版 本 分 配 了 一 个 前 面 提 到 的 基本 处 理 器 类 ， 并 添加 了 认证 信息 。 
建立 一 个 URL-opener 并 安装 它 以 便 所 有 已 打开 的 URL 能 用 到 这 


器 被 用 于 


过 程 ， 外 加 几 个 为 后 续 脚 本 使 用 的 常量 。 


码 和 urllib2 模 块 的 Python 官方 文档 是 兼容 的 。 


例 20.1 


1 
2 
$ 
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$ LOGI 
URL 


def 


17 def 


24 for 
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第 20 草 


HTTP 认 证 客户 端 (urlopenAuth.py) 


#!/usr/bin/env python 


import urllib2 


N = 'wesc* 


PASSWD = "you'llNeverGuess" 


= 'http://localhost' 


handler, version(url): 
from urlparse import urlparse as up 
hdlir = urllib2.HTTPBasicAuthHandler|() 


hdlr.add questo nc" up(url)(1], LOGIN, PASSWD) 


opener = urllib2.build opener (hdlr 
urllíb2.install opener (opener) 


return url 


request version(url): 

from base64 import encodestring 

req = urllib2.Request (url) 

b6é4str = encodestring('*$s:*s' & (LOGIN, PASSWD))[:-1] 
req.add neader("Authorization", "Basic $s” $ bó64str) 


return req 


funcType in ('handler', 'request'): 
print '*** Using *s:' * funcType.upper() 
url = eval('is version') (URL) 

f = urllib2.urlopen(url) 

print f.readline() 


f.close() 


Web ji f£ 


文 些 认 证 信息 。 


之 后 该 处 理 
这 段 代 
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这 段 代 码 的 “request 版 本 创建 了 一 个 Request 对 象 ， 并 在 HTTP 请 求 中 添加 了 基本 的 base64 编 
码 认 证 头 信息 。 返 回 “ 主 体 " 后 ( 译 者 注 : 指 for 循 环 ) 调用 urlopen() 时 ， 该 请 求 被 用 来 替换 其 中 
的 URL 字 符 串 。 注 意 原始 URL 内 建 在 Requst 对 象 中 ， 因 此 在 随后 的 urllib2. urlopen()?8 A + 4 
换 URL 字 符 串 才 不 会 产生 问题 。。 这 上 段 代码 的 灵感 来 自 Mike Foord 和 Lee Harr 在 Python 
Cookbook 上 的 回复 ， 具 体位 置 在 : 


http://aspn.activestate.com/ASPN/Cookbook/Python/Recipe/305288 
http://aspn.activestate.com/ASPN/Cookbook/Python/Recipe/267197 


如 果 能 直接 用 哈 尔 的 HTTPRealmFinder 类 就 更 好 了 ， 和 那样 我 们 就 没 必 要 在 例子 里 使 用 硬 编码 
Ta 


24 ~ 2947 


这 个 脚本 的 剩余 部 分 只 是 用 两 种 技术 分 别 打开 了 给 定 的 URL， 并 显示 服务 器 返回 的 HTML 页 面 
第 一 行 (会 弃 了 其 他 行 ) ， 当 然 前 提 是 要 通过 认证 。 注 意 如 果 认 证 信息 无 效 的 话 会 返回 一 个 
HTTP% (并 且 不 会 有 HTML) ° 


程序 的 输出 应 当 如 下 所 示 : 
$ python urlopen-auth.py 


Using handler: 
<html> 


Using request: 


«html» 


还 有 一 个 很 有 用 的 文档 可 以 在 http://www.voidspace.org.uk/python/articles/urllib2.shtml 找 到 ， 
你 可 以 把 它 作为 Python 官方 文档 的 补充 。 


20.3 ”高 级 Web 和 客户 端 


Web 浏 览 器 
wa 是 人 


是 基本 的 Web 客 户 端 ， 主 要 用 来 在 Web 上 查询 或 者 下 载 文件 。 而 Web 的 高 级 客户 
端 并 不 和 是 从 因 


特 网 上 下 载 文档 。 


高 级 Web 客 户 端的 一 个 例子 就 是 网 络 爬 虫 (也 称 疾 蛛 或 机 器 人 ) 。 这 些 程序 可 以 基于 不 同 目 
的 在 因特网 上 探索 和 下 载 页 面 ， 其 中 包括 : 


。 为 Google 和 Yahoo 这 类 大 型 的 搜索 引擎 建 索引 ; 
e 脱 机 浏览 一 一 将 文档 下 载 到 本 地 ， 重 新 设 定 超 链接 ， 为 本 地 浏览 器 创建 镜像 ; 





e 下 载 并 保存 历史 记录 或 框架 ; 
e Web 页 的 缓存 ， 节 省 再 次 访问 Web 站 点 的 下 载 时 间 。 


我 们 下 边 介绍 网 络 爬 虫 crawl.py， 抓 取 Web 的 开始 页 面 地 址 (URL) ， 下 载 该 页 面 和 其 他 后 续 
链接 页 面 ， 但 是 仅 限 于 那些 与 开始 页 面 有 着 相同 域名 的 页 面 。 如 果 没 有 这 个 限制 的 话 ， 你 的 
硬盘 将 会 被 耗 尽 ! crwal.py 的 代码 在 例 20.2 中 展示 。 


逐 行 〈 逐 个 类 ) 解释 
1~11 行 


该 脚本 的 开始 部 分 包括 Python 在 Unix 上 标准 的 初始 化 行 和 一 些 模块 属性 的 导入 ， 它 们 都 会 在 
本 应 用 程序 中 用 到 。 


13 ~ 49 行 


Retriever 类 的 责任 是 从 Web 下 载 页 面 ， 解 析 每 个 文档 中 的 链接 并 在 必要 的 时 候 把 它们 加 入 “to- 
do” 队 列 。 我 们 为 每 个 从 网 上 下 载 的 页 面 都 创建 一 个 Retriever 类 的 实例 。Retriever 中 的 方法 展 
现 了 它 的 功能 : 构造 器 (__init ()) 、filename()、download() 和 parseAndGetLinks(). 


filename() 方 法 使 用 给 定 的 URL 找 出 安全 、 有 效 的 相关 文件 名 并 存储 在 本 地 。 大 体 上 说 ， 它 会 
去 掉 URL 的 “http://" 前 级 ， 使 用 剩余 的 部 分 作为 文件 名 ， 并 创建 从 要 的 文件 夹 路 径 。 那 些 没 有 

文件 名 前 组 的 URL 则 会 被 赋予 一 个 默认 的 文件 名 "index. htm". (可 以 在 调用 fllename() 时 重新 指 
定 这 个 名 字 ) . 


构造 器 实例 化 了 一 个 Retriever 对 象 ， 并 把 URL 和 通过 filename() 获 得 的 相应 文件 名 都 作为 本 地 
属性 保存 起 来 。 


例 20.2 ”高 级 Web 客 户 端 : WAR (crawl.py ) 


这 个 仆 虫 程序 包括 两 个 类 ， 一 个 管理 整个 crawling 进 程 (Crawler) ， 一 个 检索 并 解析 每 一 个 
下 载 的 Web 页 面 (Retriever) . 


$'/usr/bin/env python 


j from sys import argV 
à from os import makedirs, unlink, sep 

from os.path import dirname, exists, isdir, splitext 
6 from string import replace, find, lower 

from htmllib import HTMLParser 


from urllib import urlretrieve 


from urlparse import urlparse, urijoin 
0 from formatter import DumbWriter, AbstractFormatter 
11 from cStringIO import StringIO 
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14 

15 def init (seif, url): 

16 self.url = url 

17 self.file ~ self.filename(url) 

18 

19 def filename(self, url, deffile*»'index.htm'): 

20 parsedurl = urlparse(url, 'http:', 0) (|. parse path 
21 path = parsedurl[1] + parsedurl[2] 

22 ext = splitext (path) 

23 if ext[1] == '': & no file, use default 

24 if path[-1] == '/*': 

25 path += deffile 

26 else: 

27 path += '/* + deffile 

28 ldir = dirname(path) 4 local directory 

29 if sep != '/': $ os-indep. path separator 

30 ldir = replace(ldir, '/*, sep) 

31 if not isdir(ldir): + create archive dir íf nec. 
32 Af exists(ldir): unlink(ldir) 

33 makedirs(1dir) 

34 return path 

35 

36 def download(self): download Web page 

37 try: 

38 retval = urlretrieve(self.url, self.file) 
39 except IOError: 

40 retval = ('*** ERROR: invalid URL "As"* *' 
41 solf.ur1,) 

42 return retval 

43 

44 def parseAndGetLinks(self):9 parse HTML, save links 
45 self.parser = HTMLParser(AbstractFormatter(* 
46 DumbWriter(StringIO()))) 

47 self.parser.feed(open(self.file).read(])) 

48 self.parser.close() 

49 return self.parser.anchorlist 

50 

51 class Crawler(object):$ manage entire crawling process 
52 

53 count = 0 8 static downloaded page counter 

54 

55 def —J init. (self, url): 

56 self.q = [url] 

5? self.seen - [] 

58 self.dom = urlparse (ur1) [1] 

59 

60 def getPage(self, url): 

61 r * Retriever (url) 
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62 retval = r.download() 

63 if retval[0] == '*': $ error situation, do not parse 
64 print retval, '... skipping parse' 

65 return 

66 Crawler.count += 1 

67 print 'in(', Crawler,count, ')' 

68 print 'URL:', url 

65 print 'FILE:', retvallo0] 

70 self.seen.append (url) 

71 

72 links = r.parseAndGetLinks() è get and process links 
73 for eachLink in links: 

74 if eachLink[:4] != 'http' and ^ 

75 find(eachLink, '://") == -1: 

76 eachLink = urljoin(url, eachLink) 

7? print '* ', eachLink, 

78 

?9 if find(lower(eachLink), 'mailto:') t= =l; 
80 print '... discarded, mailto link' 

81 continue 

82 

83 if eachLink not in seif.seen: 

84 if find(eachLink, self.dom) == -1: 

85 print '... discarded, not in domain' 
86 else: 

87 if eachLink not in selt.q: 

8s self.q.append(eachLink) 

89 print '... new, added to Q' 
90 else: 

91 print '... discarded, already in Q"' 
92 else: 

93 print '... discarded, already processed' 
94 

95 def go(self):8 process links in queue 

56 while self.q: 

97 url = self.q.popt 

98 self.getPage (url) 

95 

100 def main: 

101 if len(ergv) > 1: 

102 url = argv[i) 

103 else: 

104 try: 

105 url = raw input('Enter starting URL: ') 
106 except (KeyboardInterrupt, ECFError): 

107 uz e ** 

108 

109 if not url: return 

110 robot = Crawler (url) 

111 robot.go() 

112 

113 if. name == ' main ': 

114 main () 


正如 你 想象 的 ，download() 方 法 实际 会 连 上 网 络 去 下 载 给 定 链接 的 页 面 。 它 使 用 URL 调 用 
urllib.urlretrieve() 亟 数 并 把 结果 保存 在 filename 中 (该 值 由 flename() 返 回 ) 。 如 果 下 载 成 功 ， 
parse() 方 法 会 被 调用 来 解析 刚 从 网 络 拷贝 下 来 的 页 面 ;否则 会 返回 一 个 错误 字符 串 。 
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如 果 Crawler 判 定 没 有 错误 发 生 ， 它 会 调用 parseAndGetLinks() 方 法 来 解析 新 下 载 的 页 面 并 决 
定 该 页 面 中 每 个 链接 的 后 续 动 作 。 


51 ~ 98 行 


Crawler 类 是 这 次 演示 中 的 “明星 ”"， 掌管 在 一 个 Web 站 点 上 的 整个 抓 仆 过 程 。 如 果 我 们 为 应 用 

程序 添加 线程 ， 就 可 以 为 每 个 待 抓 仆 的 站 点 分 别 创 建 实例 。Crawler 的 构造 器 在 初始 化 过 程 中 
存储 了 三 样 东 西 ， P NOM uM a Ml 
面 处 理 完 毕 它 就 变 短 ， 在 下 载 的 页 面 中 发 现 新 的 链接 则 会 让 它 变 长 。 


Crawler 包 含 的 另 两 个 数值 是 seen, 一 个 所 有 “我们 已 看 过 ”( 已 下 载 ) 的 链接 的 
把 主 链接 的 域名 存储 在 这 里 ， 并 用 这 个 值 来 判定 后 续 链 接 是 否 是 该 域 的 一 部 分 


Crawler 还 有 一 个 静态 数据 成 员 count。 这 个 计数 器 只 是 用 来 保存 我 们 已 经 从 网 上 下 载 的 对 象 数 
目 。 每 一 个 页 面 成 功 下 载 它 就 会 增加 。 


除了 构造 器 Crawler 还 有 其 他 两 个 方法 ，getPage() 和 go(). go() 只 是 简单 地 启动 Crawler， 它 在 
代码 的 主体 部 分 被 调用 。go() 中 有 一 个 循环 ， 只 有 队列 中 还 有 待 下 载 的 新 链接 它 就 会 不 停 的 执 
行 。 然 而 这 个 的 丰 正 工作 者 ， 却 是 getPage() 方 法 。 


getPage() 初 始 化 了 一 个 Retriever 对 象 ， 并 把 第 一 个 链接 赋 给 它 然 后 让 它 执行 。 如 果 页 面 下 载 
成 功 ， 计 数 器 会 增加 并 且 链 接 会 被 加 到 “已 看 "列表 。 它 会 反复 地 检查 每 个 已 下 载 页 面 中 的 所 有 
链接 并 判决 是 否 有 链接 妥 被 加 入 待 下 载 队 列 。go() 中 的 主 储 环 会 不 停 地 推进 处 理 过 程 直到 队列 
为 室 ， 这 时 便 大 功 告 成 。 


属于 其 他 域 的 链接 、 已 经 下 载 过 的 链接 、 已 在 队列 中 待 处 理 的 链接 和 “mailto: "类 型 的 链接 在 扩 
充 队列 时 都 会 被 忽略 掉 。 

100 ~ 114 行 

main() 是 程序 运行 的 起 点 ， 它 在 该 脚本 被 直接 调用 时 执行 。 其 他 导入 crawl.py 的 模块 则 需要 调 
CR 动 处 理 过 程 。main() 需 要 一 个 URL 来 启动 处 理 ， 如 果 在 命令 行 指 定 了 一 个 (例如 


这 个 脚本 被 直接 调用 时 ) ， 它 就 会 使 用 这 个 指定 的 。 否 则 ， 脚 本 进入 交互 模式 ， 提 示 用 户 输 
入 起 始 URL 。 一 旦 有 了 起 始 链接 ，Crawler 就 会 被 实例 化 并 启动 开 来 。 


一 个 调用 crawl.py 的 例子 如 下 所 示 : 
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* crawl.py 
Enter starting URL: http://www.null.com/home/index.htmi 


43 

URL: http: //www.null.com/home/index.html 

FILE: www.null.com/home/index.html 

* http://www.null.com/home/overview.html ... new, added to Q 
* http://www.null.com/home/synopsis.html ... new, added to Q 
* http://www.null.com/home/order.html ... new, added to Q 

* mailto:postmaster8null.com ... discarded, mailto link 


* http://www.null.com/home/overview.html ... discarded, already in Q 


* http://www.null.com/home/synopsis.html ... discarded, already in Q 
* http://www.null.com/home/order.html ... discarded, already in Q 

* mailto:postmasterünull.com ... discarded, mailto link 

* http://bogus.com/index.html ... discarded, not in domain 


(21 

URL: http://www.null.com/home/order.html 

FILE: www.null.com/home/order.html 

* mailto:postmasterG$null.com ... discarded, mailto link 

* http://www.null.com/home/index.html ... discarded, already processed 


* http://www.null.com/home/synopsis.html ... discarded, already in Q 
* http://www.null.com/home/overview.html ... discarded, already in Q 


C3») 

URL: http://www.null.com/home/synopsis.html 

FILE: www.null.com/home/synopsis.html 

* http://www.null.com/home/index.html ... discarded, already processed 
* http://www.null.com/home/order.html ... discarded, already processed 


* http://www.null.com/home/overview,html ... discarded, already in Q 


(41 

URL: http: //www.null.com/home/overview.html 

FILE: www.null.com/home/overview,.html 

* http://www.null.com/home/synopsis.html ... discarded, already processed 
* http://www.null.com/home/index.html ... discarded, already processed 

* http://www.null.com/home/synopsis.html ... discarded, already processed 
* http://www.null.com/home/order.html ... discarded, already processed 


执行 后 ， 在 本 地 的 系统 文件 中 将 会 在 创建 一 个 名 为 www.nullcom 的 目录 及 子 目录 。 左 右 的 
HTML 文 件 都 会 显示 在 主 目录 下 。 


20.4 CGI: 帮助 Web 服 务 器 处 理 客 户 端 数据 


20.4.1 CGI 介绍 


Web 开 发 的 最 初 目的 是 在 全 球 范围 内 对 文档 进行 存储 和 归档 (大 多 是 教学 和 科研 目的 的 ) 。 
这 些 零碎 的 信息 通常 产生 于 前 态 的 文本 或 HTMIL， 
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HTML 是 一 个 文本 格式 而 算 不 上 是 一 种 语言 ， 它 包括 改变 字体 的 类 型 、 大 小 、 风 格 。HTML 的 
主要 特性 在 于 它 对 超 文本 的 兼容 性 ， 文 本 以 某 种 高 完 的 形式 指向 另外 一 个 相关 文档 。 可 以 通 
过 和 鼠标 点 击 或 者 其 他 用 户 的 选择 机 制 来 访问 这 类 文档 。 这 些 静 态 的 HTML 文 档 在 Web 服 务 器 
上 ， 在 有 请 求 时 ， 将 被 送 到 客户 端 。 


随 着 因特网 和 Web 服 务 器 的 形成 ， 产 生 了 处 理 用 户 输入 的 需求 。 在 线 零 信 商 需要 能 够 单独 订 
货 ， 网 上 银行 和 搜索 引擎 需要 为 用 户 分 别 建 立 账 号 。 因 此 发 明了 这 种 执行 模式 ， 并 成 为 了 
Web 站 点 可 以 从 用 户 那 里 获得 特殊 信息 的 唯一 形式 (在 Java applet 出 现 之 前 ) 。 反 过 来 ， 在 
客户 提交 了 特定 数据 后 ， 就 要 求 立即 生成 HTML 页 面 。 


现在 Web 服 务 器 仅 有 一 点 做 得 很 不 错 : 获取 用 户 对 文件 的 请 求 ， 并 将 这 个 文件 (也 就 是 说 
HTML 文 件 ) 返回 给 客户 端 。 它们 现在 还 不 具有 处 理 字段 类 特殊 数据 的 机 制 。 将 这 些 请 求 送 到 
可 以 生成 动态 HTML 页 面 的 扩展 应 用 程序 中 并 返回 给 客户 端 ， 这 些 还 没有 成 为 Web 服 务 器 的 职 


责 。 


这 整个 过 程 开 始 于 Web 服 务 器 从 客户 端 接 到 了 请 求 (GET 或 者 POST) ， 并 调用 合适 的 程序 。 
然后 开始 等 待 HTML 页 面 一 一 与 此 同时 ， 客 户 端 也 在 等 待 。 一 旦 程序 完成 ， 会 将 生成 的 动态 
HTML 页 面 返回 到 服务 器 端 ， 然 后 服务 器 端 再 将 这 个 最 终结 果 返 回 给 用 户 。 服 务 器 接 到 表单 反 
馈 ， 与 外 部 应 用 程序 交互 ， 收 到 并 返回 新 生成 的 HTML 页 面 都 发 生 在 一 个 叫做 Web 服 务 器 
CGI (标准 网 关 接 口 ，CommonGateway Interface) 的 接口 上 。 图 20-3 描 述 了 CGI 的 工作 原 
理 ， 逐 步 展 示 了 一 个 用 户 从 提交 表单 到 返回 最 终结 果 Web 页 面 的 整个 执行 过 程 和 数据 流 。 


Web Browser (Cieni) CGI Application 


A— 
Sony d ca f 





图 20-3 CGI 工作 概要 图 。CGI 代 表 了 在 一 个 Web 服 务 器 和 能 够 处 理 用 户 表 单 、 生 成 并 
返回 动态 HTML 页 的 应 用 程序 间 的 交互 
客户 端 输 入 给 Web 服 务 器 端的 表单 可 能 包括 处 理 过 程 和 一 些 存储 在 后 台数 据 库 中 的 表单 。 需 
要 记 住 的 是 ， 在 任何 时 候 都 可 能 有 任何 一 个 用 户 去 填写 这 个 字段 ， 或 者 点 击 提交 按钮 或 图 
片 ， 这 更 像 激活 了 某 种 CGI 活动 。 
创建 HTML 的 CGI 应 用 程序 通常 是 用 高 级 编程 语言 来 实现 的 ， 可 以 接受 、 处 理 数据 ， 向 服务 器 
端 返回 HTML 页 面 。 目 前 使 用 的 编程 语言 有 Perl|、PHP 、C/C++ 或 Python. 


在 我 们 研究 CGI 之 前 ， 我 们 必须 告诉 你 典型 的 Web 应 用 产品 已 经 不 再 使 用 CGI 了 。 


由 于 它 词义 的 局 限 性 和 允许 Web 服 务 器 处 理 大 量 模拟 客户 端 数据 能 力 的 局 限 性 ，CGI 几 乎 绝 
迹 。Web 服 务 的 关键 使 命 依赖 于 遵循 像 C/C++ 这 样 的 语言 规范 。 如 今 的 Web 服 务 器 典型 的 部 
件 有 Aphache 和 集成 的 数据 库 部 件 (MySQL 或 者 PostgreSQL) ^ Java (Tomcat) ^ PHP 
和 各 种 Perl 模 块 、Python 模 块 ， 以 及 SSL/security。 然 而 ， 如 果 你 工作 在 私人 小 型 的 或 者 小 组 
织 的 Web 网 站 上 的 话 就 没有 必要 使 用 这 种 强大 而 复杂 的 Web 服 务 器 ，CGI 是 一 个 适用 于 小 型 
Web 网 站 开发 的 工具 。 


更 进一步 来 说 ， 有 很 多 Web 应 用 程序 开发 框架 和 内 容 管 理 系统 ， 这 些 都 弥补 了 过 去 CGI 的 不 

足 。 然 而 ， 在 这 些 浓 缩 和 升华 下 ， 它 们 仍 昌 遵循 CGI 最 初 提 供 的 模式 ， 可 以 允许 用 户 输入 ， 根 
据 输 入 执行 找 贝 ， 并 提供 了 一 个 有 效 的 HTML 作 为 最 终 的 客户 端 输出 。 因 此 ， 为 了 开发 更 加 高 
效 的 Web 服 务 ， 有 必要 理解 CGI 实现 的 基本 原理 。 


在 下 一 部 分 中 ， 我 们 将 会 关注 在 cgij 模 块 的 协助 下 如 何在 Python 中 建立 一 个 CGI 应 用 程序 。 


20.4.0 CGI 应 用 程序 


CGI 应 用 程序 和 典型 的 应 用 程序 有 些 不 同 。 主 要 的 区 别 在 于 和 输入、 输出 及 用 户 和 计算 机 交互 方 
面 。 当 一 个 CGI 脚本 开始 执行 时 ， 它 需要 检索 "用户 -支持 "表单 ， 但 这 些 数据 必须 要 从 Web 的 客 
户 端 才 可 以 获得 ， 而 不 是 从 服务 器 或 者 硬盘 上 获得 。 


这 些 不 同 于 标准 输出 的 输出 将 会 返回 到 连接 的 Web 客 户 端 ， 而 不 是 返回 到 屏幕 、CUI 窗 口 或 者 
硬盘 上 。 这 些 返回 来 的 数据 必须 是 具有 一 系列 有 效 头 文件 的 HTML。 和 否则， 如 果 浏 览 器 是 Web 
的 客户 端 ， 由 于 浏览 器 只 能 识别 有 效 的 HTTP 数 据 (也 就 是 MIME 头 和 HTML ) ， 那 么 返回 的 
也 只 能 是 个 错误 消息 (具体 的 就 是 因特网 服务 器 错误 ) . 


最 后 ， 可 能 和 你 想象 的 一 样 ， 用 户 不 能 与 脚本 进行 交互 。 所 有 的 交互 都 将 发 生 在 Web 客 户 端 
(用 户 的 行为 ) 、Web 服 务 器 端 和 CGI 应 用 程序 间 。 


20.4.3 cgi 


在 cgi 模 块 中 有 个 主要 类 ， 即 FieldStorage 类 ， 它 完成 了 所 有 的 工作 。 在 Python CGI 脚本 开始 
时 这 个 类 将 会 被 实例 化 ， 它 会 从 Web 客 户 端 (有 具 有 Web 服 务 器 ) 读 出 有 关 的 用 户 信息 。 一 旦 
这 个 对 象 被 实例 化 ， 它 将 会 包含 一 个 类 似 字 典 的 对 象 ， 具 有 一 系列 的 键 - 值 对 ， 键 就 是 通过 表 
单传 入 的 表单 条 目的 名 字 ， 而 值 则 包含 相应 的 数据 。 


这 些 值 本 身 可 以 是 以 下 三 种 对 象 之 一 。 它 们 既 可 以 是 FieldStorage 对 象 (实例) ， 也 可 以 是 另 
一 个 类 似 的 名 为 MiniFieldStorage 类 的 实例 ， 后 者 用 在 没有 文件 上 传 或 mulitple-part 格 式 数据 
的 情况 。MiniFieldStorage 实 例 只 包含 名 字 和 数据 的 键 - 值 对 。 最 后 ， 它 们 还 可 以 是 这 些 对 象 的 
列表 。 这 发 生 在 表单 中 的 菜 个 域 有 多 个 输入 值 的 情况 下 。 


对 于 简单 的 Web 表 单 ， 你 将 会 经 常 发 现 所 有 的 MiniFieldStorage 实 例 。 下 边 包含 的 所 有 的 例子 
都 仅 针 对 这 种 情况 。 


20.5 ”建立 CGI 应 用 程序 


20.5.1 建立 Web 服 务 器 


为 了 可 以 用 Python 进行 CGI 开发 ， 你 首先 需要 安装 一 个 Web 服 务 器 ， 将 其 配置 成 可 以 处 理 
Python CGI 请 求 的 模式 ， 然 后 让 你 的 Web 服 务 器 访问 CGI 脚本 。 其 中 有 些 操作 你 也 许 需要 获 
得 系统 管理 员 的 帮助 。 


如 果 你 需要 一 个 监 正 的 Web 服 务 器 ， 可 以 下 载 并 安装 Aphache. Aphache 的 插件 或 模块 可 以 处 
理 Python CGI， 但 这 在 我 们 的 例子 里 并 不 是 必要 的 。 如 果 你 准备 把 自己 的 服务 “ 带 入 真实 世 
界 ”， 也许 会 想 安 装 这 些 软 件 ， 尽 管 它们 似乎 过 于 强大 。 


为 了 学 习 的 目的 或 者 是 建立 小 型 的 Web 站 点 ， 使 用 Python 自身 带 的 Web 服 务 器 就 已 经 足够 
了 。 在 第 20.8 节 ， 你 将 会 实际 地 学 习 如 何 建立 和 配置 简单 的 基于 Python 的 Web 服 务 器 。 如 果 
你 想 在 本 阶段 获得 更 多 知识 ， 也 可 以 现在 提前 阅读 那 部 分 。 然 而 ， 这 并 不 是 本 章 的 焦点 。 


如 果 你 只 是 想 建立 一 个 基于 Web 的 服务 器 ， 可 以 直接 执行 下 边 的 Python 语句 。 


$ python -m CGIHTTPServer 
-m 选 项 是 在 2. 4 中 新 引进 的 ， 如 果 你 使 用 的 是 比 这 旧 的 Python 版 本， 或 者 想 看 一 下 它 执行 的 
不 同方 式 ， 请 看 14.4.3 节 。 无 论 如 何 ， 最 终 它 需要 工作 起 来 。 


这 将 会 在 当前 机 器 的 当前 目录 下 建立 一 个 端口 号 为 8000 的 Web 服 务 器 ， 然 后 可 以 在 启动 这 个 
服务 器 的 目录 下 建立 一 个 Cgi-bin， 将 Python CGI 脚本 放 到 那里 。 将 一 些 HTML 文 件 放 到 那个 
目录 下 ， 或 许 有 些 。py CGI 脚本 在 Cgi-bin 中 ， 然 后 就 可 以 在 地 址 栏 中 输入 这 些 地 址 来 访问 
Web 站 点 了 。 


http://localhost:8000/friends.htm 


http://localhost:8000/cgi-bin/friends2.py 


20.5.2 建立 表单 页 
在 例 20.3 中 ， 我 们 写 了 一 个 简单 的 Web 表 单 friends.html 。 


正如 你 可 以 在 代码 中 看 到 的 一 样 ， 这 个 表单 包括 两 个 输入 变量 : person 和 howmany， 这 两 个 
值 将 会 被 传 到 我 们 的 CGI 脚本 friendsl.py 中 。 


你 会 注意 到 在 例子 中 我 们 将 CGI 脚本 初始 化 到 主机 默认 的 cgi-bin 目 录 下 ("Action" 连 接 ) (如 
果 这 个 信息 与 你 开发 环境 不 一 样 的 话 ， 在 测试 Web 页 面 和 CGI 之 前 请 更 新 你 的 表单 事件 ) 。 同 
时 由 于 表单 事件 中 缺少 METHOD 子 标签 ， 所 有 的 请 求 将 会 采用 默认 的 GET 方 法 。 选 择 GET 方 
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法 是 因为 我 们 的 表单 没有 太 多 的 字段 ， 同 时 我 们 希望 我 们 的 请 求 字段 可 以 在 “位 置 ”(aka 
"Address", "Go To”) 条 中 显示 ， 以 便 你 可 以 看 到 被 送 到 服务 器 端的 URL 。 


例 20.3 静态 表单 页 (friends. htm) 
这 个 HTML 文 件 展示 给 用 户 一 个 空 文档 ， 含 有 用 户 名 和 一 系列 可 供用 户 选择 的 单 选 按钮 。 


<HTML> <HEAD><TITLE> 

Friends CGI Demo (static screen) 

</TITLE>< /HEAD> 

«BODY»«H3»Friends list for: «I»NEW USER</I></H3> 

<FORM ACTION-"/cgi-bin/friendsl.py"» 

«B»Enter your Name:«/B» 

<INPUT TYPE-text NAME-person VALUE-"NEW USER" SIZE-15» 

<P><B>How many friends do you have?</B> 

<INPUT TYPE-radio NAME-howmany VALUE-"O" CHECKED» 0 

<INPUT TYPE-radio NAME-howmany VALUE-"10"» 10 

<INPUT TYPE-radio NAME=howmany VALUEs"25"» 25 

<INPUT TYPE-radio NAME-howmany VALUE-"50"» 50 

<INPUT TYPE-radio NAME-howmany VALUE-"100"» 100 
«P»«INPUT TYPE=submit></FORM></BODY></HTML> 


(o 0o - O U — € t P 


H e e HM B 
b Ww N a O 


让 我 们 看 看 friends.htm 提 交 后 在 客户 端 屏幕 上 的 显示 (120-4 Safari, MacOS f» 20-5 IE6) 


y T 





ez 
vue 


8000/friends.htm 


YA 


Friends list for: VEW USER 


Enter vour Name: NEW USER 


How many friends do you have? & 0 O 10 O 25 O 50 O 100 





图 20-4 Friends & € Xi Mac OS X 操 作 系统 Safari 浏 览 器 上 的 显示 (friends.htm) 
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Enter your Name: 


How many friends do yon have? € 0 C 10 C 25 C 50 C 100 





图 20-5 friends & 3€ 31 dn 4€ Win323& 4E A AIE 6 浏览 器 上 的 显示 (friends.htm ) 


通过 本 章 ， 我 们 将 会 展示 来 自 不 同 Web 浏 览 器 和 操作 系统 的 屏幕 截图 。 


20.5.3 生成 结果 页 


这 些 输入 是 由 用 户 完成 的 ， 然 后 按 下 了 “Submit* 按 钮 (可 选 的 ， 用 户 也 可 以 在 该 文本 字段 中 按 
下 回 车 键 获 得 相同 的 效果 ) 。 当 这 些 发 生 后 ， 在 例 20.4 中 的 脚本 ，friendsl.py 将 会 随 CGI 一 起 
被 执行 。 


这 个 脚本 包含 了 所 有 的 编程 功能 ， 读 出 并 处 理 表 单 的 输入 ， 同 时 向 用 户 返 回 结果 HTML 页 面 。 
所 有 的 这 些 “ 实 际 "的 工作 仅 是 通过 4 行 Python 代码 来 实现 的 《14~17 行 ) . 


表单 的 变量 是 FieldStorage 的 实例 ， 包 含 person 和 howmanyh 字 段 的 值 。 我 们 把 这 些 值 本 分 别 
APN UNDO TRORIORy OE 量 中 。 变 量 reshtml 包 含 需要 返回 的 HTML 文 本 的 正文 ， 还 有 
一 些 动 态 填 好 的 字段 ， 这 些 数据 都 是 从 表单 中 读 入 的 。 


例 20.4 CGI 代 码 结果 示 图 (friendsl.py ) 


CGI 脚本 在 表单 上 抓 取 person 和 howmany 字 段 ， 并 用 这 些 数据 生成 动态 的 结果 示 图 。 


f!/usr/bin/env python 


1 
2 
3 import cgi 
4 
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5  reshtml = '''Content-Type: text/htmlWn 

6 <HTML><HEAD><TITLE> 

7 Friends CGI Demo (dynamic screen) 

8 </TITLE></HEAD> 

9  «BODY»«H3»Friends list for: <I>%s</I></H3> 
10 Your name is: «B»*s«/B»«P» 

11 You have «B»$s«/B» friends. 

12 «/BODY»«/HTML»''' 


14 form = cgi.FieldStorage() 
15 who = form['person'].value 
16 howmany = form['howmany'].value 


17 print reshtml % (who, who, howmany) 





核心 提示 : HTML 头 文件 是 从 HTML 中 分 离 出 来 的 


有 一 点 th 明 的 是 ， 在 向 CGI 脚 本 返回 结果 时 ， 须 先 返 回 一 个 适当 的 HTTP 头 
文件 后 才 会 返回 结果 HTML 页 面 。 进 一 步 说 ， 为 了 区 分 这 些 头 文件 和 结果 HTML 页 面 ， 需 要 在 
is 5 行 中 插入 几 个 换行 符 。 在 本 章 后 边 的 代码 中 也 是 这 样 处 理 的 。 


EID Ge de 出 现 的 屏幕 显示 ， 假 设 用 户 输 入 的 名 字 为 “erick allen" > € i:*10friends" € 3t dz 
钮 。 这 次 的 屏幕 截图 展示 的 是 在 Windows 环 境 下 |E 3 浏览 器 中 的 效果 。 
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如 果 你 是 一 个 Web 站 点 的 生产 商 ， 你 也 许 会 想 ，“ 如 果 这 个 人 忘记 了 的 话 ， 我 能 自动 地 将 这 个 
人 的 名 字 大 写 ， 会 不 会 更 好 些 ? "这 个 通过 Python 的 CGI 可 以 很 容易 地 实现 (我们 很 快 就 会 进 
行 试验 | ) o 


注意 GET 请 求 是 如 何 将 表单 中 的 变量 和 值 加 载 在 URL 地 址 条 中 的 。 你 是 否 观 察 到 了 friends. 
htm 页 面 的 标题 有 个 “static”， 而 friends.py 脚 本 输出 到 屏幕 上 的 则 是 “dynamic”? 我 们 这 样 做 的 
一 个 原因 就 是 : 指明 friends. htm 文 件 是 一 个 静态 的 文本 ， 而 结果 页 面 却 是 动态 生成 的 。 换 多 
话说 ， 结 果 页 面 的 HTML 不 是 以 文本 文件 的 形式 存在 硬盘 上 的 ， 而 是 由 我 们 的 CGI 脚本 生成 
的 ， 并 且 将 其 以 本 地 文件 的 形式 返回 


在 下 边 的 例子 中 ， 我 们 将 会 更 新 我 们 的 CGI 脚本 ， 使 其 变 得 更 灵活 些 ， 从 而 完全 绕 过 静态 文 
件 。 


20.5.4 生成 表单 和 结果 页 面 


我 们 删除 fiends. html 文 件 并 将 其 合并 到 friends2.py 中 。 这 个 脚本 现在 将 会 同时 生成 表单 页 和 

结果 页 面 。 但 是 我 们 如 何 控制 生成 哪个 页 面 呢 ? 好 吧 ， 如 果 有 表单 数据 被 发 送 ， 那 就 意味 着 
我 们 需要 建立 一 个 结果 页 面 。 如 果 我 们 没有 获得 任何 的 信息 ， 这 就 说 明 我 们 需要 生成 一 个 用 
户 可 以 输入 数据 的 表单 页 面 


例 20.5 展 示 的 就 是 我 们 的 新 脚本 friends2.py。 
么 我 们 改变 了 哪些 脚本 呢 ? 让 我 们 一 起 看 下 这 个 脚本 的 代码 块 。 


逐 行 解释 


通常 的 起 始 和 模块 导入 行 ， 我 们 还 把 HTTP poo qe 文部 分 分 离 出 来 ， 
放 在 了 这 里 。 因 为 我 们 将 在 返回 的 两 种 页 面 (表单 页 面 和 结果 页 面 ) 中 都 使 用 它 ， 而 又 不 想 
重复 写 文本 。 当 需要 输出 时 ， 我 们 将 把 这 te 


7 ~ 29 行 


所 有 这 些 代码 都 是 为 了 整合 CGI 脚本 里 的 friends.htm 表 单 页 面 。 我 们 对 表单 页 面 的 文本 使 用 一 
RU ， 还 有 一 个 用 来 创建 单 选 按钮 的 字符 串 变 量 fradio 。 e ii ud 

个 单 选 按钮 HTML 文 本 ， 但 我 们 意 在 展示 如 何 使 用 Python 来 生成 更 多 的 亏 
22 E: 的 for 循 环 。 





showForm() 有 函数 负责 对 用 户 输 入 生成 表单 页 。 它 为 T e > 并 把 这 些 
HTML 文 本 行 合并 到 了 formhtml 主 体 中 ， 然 后 给 表单 加 上 头 信 息 ， 最 后 通过 把 整个 字符 串 输出 
到 标准 输出 的 方式 给 客户 端 返回 了 整 块 数据 


例 20.5 生成 表单 和 结果 页 面 (friends2.py ) 
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将 friends.html 和 friendsl.py 合 并 成 friends2.py。 得 到 的 脚本 可 以 同时 显示 表单 和 动态 生成 的 
HTML 结 果 页 面 ， 同 时 可 以 巧妙 地 知道 应 该 输出 哪个 页 面 。 


1 
2 
3 
5 
5 
6 
7 
8 
9 


10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 


$!/usr/bin/env python 


import cgi 


header = 'Content-Type: text/htmlMnAn' 


formhtml = '''<HTML><HEAD><TITLE> 

Friends CGI Demo</TITLE></HEAD> 

<BODY><H3>Friends list for: <I>NEW USER</I></H3> 
<FORM ACTION-"/cgi-bin/friends2.py"» 

<B>Enter your Name:</B> 

<INPUT TYPE=hidden NAME=action VALUEmedit> 

<INPUT TYPE=text NAME=person VALUE="NEW USER" SIZE=15> 
<P><B>How many friends do you have?</B> 

$s 

<P><INPUT TYPE=submit></FORM></BODY></HTML>''' 


fradio = '«INPUT TYPE=radio NAMEehowmany VALUEe€"$s" €$s» tsWn' 


def showForm(): 
friends = '' 
for i in (0, 10, 25, 50, 100]: 
checked = '' 
if i == 0: 
checked = 'CHECKED' 
friends = friends + fradio $% WV 
(str(i), checked, str(i)) 


print header + formhtml $ (friends) 


resntml = '''«HTML^«HEAD^-TITLE^ 
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32 Friends CGI Demo«/TITLE»-/HEAD» 

33 «BODY»«H3»Friends list for: «I»5*s«/I»«/H3» 
34 Your name is: «B»&sc/B»«P» 

15 You have «B»*s«/B» friends. 


36 «/BODY^»«/HTMI2''' 
1 


38 def doResults(who, howmany): 


39 print header + reshtml $ (who, who, howmany) 


41 def process() 
A 
+ 


42 form = cgi.FieldStorage() 

43 if form.has key('person'): 
44 who = form['person'l.value 
45 else: 

46 who NEW USER' 

17 

48 if form. key ('howmany'} : 
49 howmany form['howmany'l.value 
50 else: 

51 howmany = 0 

53 if form.has key('action') 

54 doResults (who, howmany) 
55 else: 

56 |i'owForm() 

57 

QU. Af name == ' main 

59 process( 


这 段 代码 中 有 两 件 有 趣 的 事 值 得 注意 。 第 一 点 是 表单 中 12 行 action 处 的 “hidden? 变 量 ， 这 里 的 
值 为 “edit*。 我 们 决定 显示 哪个 页 面 (表单 页 面 或 是 结果 页 面 ) 的 唯一 途径 是 通过 这 个 字段 。 
我 们 将 在 第 53~56 行 看 到 这 个 字段 如 何 起 作用 。 


还 有 ， 请 注意 我 们 在 生成 所 有 按钮 的 循环 里 把 单 选 按钮 0 设置 为 默认 按钮 。 这 表明 我 们 可 以 在 
一 行 代码 里 (第 18 行 ) 更 新 单 选 按钮 的 布局 和 /或 它们 的 值 ， 而 不 用 再 写 多 行文 字 。 这 也 同时 
提供 了 更 多 的 灵活 性 ， 可 以 用 逻辑 来 判断 哪个 单 选 按钮 被 选中 ， 见 我 们 脚本 的 下 一 个 升级 
版 ， 后 面 的 friends3.py。 


现在 你 aes 既然 我 也 可 以 选择 person 或 howmany 是 否 出 现 ， 那 为 什么 我 们 要 用 一 个 
action 变 量 呢 ? "这 是 一 个 很 好 的 问题 ， 因 为 在 这 种 情况 下 你 当然 可 以 只 用 person 或 
hwomany ° 


然而 ，action 变 量 代表 了 一 种 更 明显 的 出 现 ， 不 光 是 它 的 名 字 还 有 它 的 作用 ， 其 代码 很 容易 理 
解 。person 和 howmany 变 量 都 是 对 其 值 起 作用 ， 而 action 变 量 则 被 用 作 一 个 标志 。 
创立 action 的 另 一 个 原因 是 我 们 将 会 再 一 次 使 用 它 来 帮助 我 们 决定 生成 哪 一 页 。 具 体 来 说 ， 我 


们 需要 在 person 变 量 出 现时 会 显示 一 个 表单 (而 不 是 生成 结果 页 面 ) 一 如 果 在 这 里 仅 依赖 
person 变 量 ， 你 的 代码 运行 将 失败 。 
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31 ~ 39 行 
显示 结果 页 的 代码 实际 上 和 friendsl.py 中 的 一 样 。 
41 ~ 56 行 


因为 这 个 脚本 可 以 产生 出 不 同 的 页 面 ， 所 以 我 们 创建 了 一 个 包括 一 切 的 process() 元 数 来 获得 
表单 数据 并 决定 采用 何 种 动作 。 看 起 来 process() 的 主体 部 分 也 和 friendsl.py 中 主体 部 分 的 代码 
相似 。 然 而 它们 有 两 个 主要 的 不 同 。 


因为 这 个 脚本 也 许可 以 ， 也 许 不 能 取得 所 期 待 的 字段 (例如 ， 第 一 次 运行 脚本 时 生成 一 个 表 
单 页 ， 这 样 的 话 就 不 会 给 服务 器 传递 任何 字段 ) ， 我 们 需要 用 if 语句 把 从 表单 项 取得 的 值 " 括 起 
来 ”， 并 检查 它们 此 时 是 否 有 效 。 还 有 我 们 上 面 提 到 的 action 字 段 ， 它 可 以 帮助 我 们 判定 应 生 
成 哪 一 个 页 面 。 第 53 一 56 行 作 了 这 种 判定 。 


在 图 20-7 和 图 20-8 中 ， 你 会 先 看 到 脚本 生成 的 表单 页 面 〈 已 经 输入 了 一 个 名 字 并 选择 了 一 个 
单 选 按钮 ) ， 然 后 是 结果 页 面 ， 也 是 这 个 脚本 生成 的 。 


} Friends CGI Demo - Mozilla Firefox 


| Friends list for: NEW USER 


| Enter your Name: [john doe | 


| How many friends do you haye? C 0 C 10 € 25 C 50 C 100 





图 20-7 Friends 表 单 页 面 在 Win32 操 作 系 统 Firefox1.x 浏 览 器 上 的 显示 (friends2.py) 


第 20 章 ”Web 编程 850 


Python 核心 编程 第 二 版 


;Friends CGI Demo - Mozilla Firefox 


|! Friends list for: john doe 
| 


| Your name is: john doe 


You have 25 fnends. 





图 20-8 Friends 结 果 页 面 在 Win32 操 作 系统 Firefox 浏 览 器 上 的 显示 (friends2.py ) 
如 果 看 一 下 位 置 或 “ 转 到 " 栏 ， 你 将 不 会 看 到 一 个 对 friends. htm 静 态 文件 的 URL ， 而 在 图 20-4 和 
图 20-5 中 都 有 。 
20.5.5 全面 交互 的 Web 站 点 


我 们 最 后 一 个 例子 将 会 完成 这 个 循环 。 如 在 前 面 中 ， 用 户 在 表单 页 中 输入 他 的 信息 ， 然 后 我 
们 处 理 这 些 数据 ， 并 输出 一 个 结果 页 面 。 现 在 我 们 将 会 在 结果 页 面 上 加 个 链接 允许 返回 到 表 
单 页 面 ， 但 是 我 们 返回 的 是 含有 用 户 输入 信息 的 页 面 而 不 是 一 个 空白 页 面 。 我 们 页 加 上 了 一 
些 错误 处 理 程序 ， 来 展示 它 是 如 何 实现 的 。 


现在 在 例子 20.6 中 我 们 展示 我 们 最 后 的 更 新 ，friends3.py。 


friends3.py 和 friends2.py 没 有 太 大 的 不 同 。 我 们 请 读者 比较 不 同 处 ; 这 里 我 们 简要 的 介绍 了 
要 的 不 同 点 。 

简略 的 和 逐 行 解 释 

第 8 行 

我 们 把 URL 从 表单 中 抽出 来 是 因为 现在 有 两 个 地 方 需要 它 ， 结 果 页 面 是 它 的 新 顾客 。 


10 ~ 19 行 、69 ~ 71 行 、75 ~ 82 行 





所 有 这 些 行 都 用 来 处 理 新 特性 HX 页面。 如 果 用 户 没 有 选择 单 选 按钮 ， 指 明 朋 友 数 量 ， 
那么 howmany 字 段 就 不 会 传送 mie ' ERFA OUT > showError() £& Zi 2-38 wl — 4- 48x 9 
面 给 客户 。 
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单 ， 但 不 需要 有 动作 ， 因 为 我 们 只 是 简单 地 后 退 到 浏览 器 历史 中 的 上 一 个 页 面 。 尽 管 我 们 的 
脚本 目前 只 支持 (或 者 说 探测 、 测 试 ) 一 种 类 型 的 错误 ， 但 我 们 仍然 使 用 了 一 个 通用 的 error 
变量 ， 这 是 为 了 以 后 还 可 以 继续 开发 这 个 脚本 ， 给 它 增加 更 多 的 错误 检测 。 


例 20.6 ”全 用 户 交 互 和 错误 处 理 (friends3.py) 


通过 加 上 返回 输入 信息 的 表单 页 面 的 连接 ， 我 们 实现 了 整个 循环 ， 给 了 用 户 一 次 完整 M 
应 用 体验 。 我 们 的 应 用 程序 现在 也 进行 了 一 些 简单 的 错误 验证 ， 在 用 户 没 有 选择 任何 单 选 
钮 时 ， 可 以 通知 用 户 。 


1 b! /usr/bin/env python 
2 
3 import cgi 


4 from urllib import quote plus 
5 from string import capwords 


header = 'Content-Type: text/htmlinWn" 


8 url = '/cgi-bin/friends3.py"' 


10 errhtml = '''cHTML^«HEAD^«TITLE»^ 

11 Friends CGI Demo</TITLE></HEAD> 

12 «BODY»«H3»ERROR«/H3» 

13 «B»4sc/B»«p» 

14 <FORM><INPUT> TYPE-button VALUE*Back 
15 ONCLICK-"window,.history.backí)"»«/FORM^ 
16 «/BODY»-/HTML»''' 


18 def showError(error str): 


19 print header + errhtm]l $ (error,str) 


21 formhtrzrl = '''c«HTML^«HEAD^-TITLE» 

22 Friends CGI Democ/TITLE»«/HEAD» 

23 «BODY»-«H3»Friends list for: «I»5s«/I»«/H3» 
«FORM ACTION-"i5"» 





25 «B»Your Name:«/B» 

26 <INPUT TYPE-hidden NAMEsaction VALUE-edit» 

27 <INPUT TYPE-text NAME»person VALUE»"a4 ZE»1 
28 «P»«B»How many friends do you have?«/B» 

29 $s 

30 «P»«INPUT TYPE*submit»«/FORMo«/BODY»« /WTML» ' ' ' 
31 


32 fradio = '«INPUT TYPE-radic NAME-howmany VALUE-"4s" $15» 


ts\n' 


34 def showForm(who, howmany): 


35 friends = '' 

3f for i in [0, 10, 25, 50, 100): 

37 checked = '' 

38 if str(i] == howzany: 

35 checked = 'CHECKED' 

40 friends = friends + fradio $ \ 

41 (str(i], checked, stríii)) 

42 print header + formhtmel *& (who, url, who, friends) 
43 


44 reshtml = '''«HTML^«HEAD^«TITLE»^ 

45 Friends CGI Democ/TITLE»«/HEAD-» 

46 «BODY»«H3»5Friends list for: «I»*s«/I»«/H3» 
47 Your name is: «B»isc/B»«P» 


48 You have «B»t*s«/B» friends. 





OOZz 


49 «P»Click «A HREF="¢s">here</A> to edit your data again. 
50 </BODY></HTML>''' 


52 def doResults(who, howmany): 


53 newurl = url + '?action-reedit&person*t&s&howmany*is "SN 
54 (quote plus(who), howmany) 
55 print header + reshtml $ (who, who, howmany, newurl) 


57 def process): 


58 error = '' 

59 form cgi.FieldStorage!() 

6t 

61 if form.hàas key('person'): 

62 who = capwords(form['person'].value) 

63 else: 

64 who = 'NEW USER' 

65 

66 if form.has key('howmany") : 

67 howmany = form['howmany'].value 

68 else: 

69 if form.has key('action') and \ 

70 form['action'].value == 'edit': 

71 error = 'Please select number of friends." 

72 else: 

73 howmany = 0 

74 

75 if not error: 

76 if form.has key('action') and ^ 
form['action'].value != 'reedit': 

78 doResults(who, howmany) 

79 else: 

BO showForm(who, nowmany) 

8 else: 

82 showError (error) 

B 


B4 if name == ' main 


85 process() 
第 27 行 、38 ~ 41 行 、49 行 、52 ~ 5513 


这 个 脚本 的 一 个 目的 是 创建 一 个 有 意义 的 链接 ， 以 便 从 结果 页 面 返回 表单 页 面 。 当 有 错误 发 
生 时 ， 用 户 可 以 使 用 这 个 链接 返回 表单 页 面 去 更 新 他 /她 填写 的 数据 。 新 的 表单 页 面 只 有 当 它 
包含 了 用 户 先前 输入 的 信息 时 才 有 意义 (如果 让 用 户 重复 输入 这 些 信息 会 很 令 人 肖 吕 ) 。 


为 了 实现 这 一 点 ， 我 们 需要 把 当前 值 诬 入 到 更 新 过 的 表单 中 。 在 第 27 行 ， 我 们 给 name 新 增 了 
一 个 值 。 这 个 值 如 果 给 出 的 话 ， 会 被 插入 到 name 字段。 显然 ， 在 初始 表单 页 面 上 它 将 是 空 
值 。 第 38~41 行 ， 我 们 根据 当前 选 定 的 朋友 数目 设置 了 单 选 按钮 。 最 后 ， 通 过 第 49 行 和 第 
52 一 55 行 更 新 了 的 doResults() 函 数 ， 我 们 创建 了 这 个 包含 已 有 信息 的 链接 ， 它 会 让 用 户 “ 返 
回 "到 我 们 更 改 后 的 表单 页 面 。 


62 行 
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我 们 从 美学 角度 上 加 了 一 个 简单 的 特性 。 在 friendsl.py 和 friends2.py 的 截屏 中 ， ee 
回 结果 和 用 户 的 输入 一 字 不 差 。 在 上 述 的 截屏 中 ， 如 果 用 户 的 名 字 没 有 大 写 这 将 影响 

的 页 面 。 我 们 加 了 一 个 对 string.capwords() 郊 数 的 调用 从 而 自动 的 将 用 户 名 置 成 大 写 

capwords() 有 函数 可 以 将 传 进来 的 每 个 单词 的 第 一 个 字母 置 成 大 写 的。 这 也 许 是 或 许 不 是 必要 

的 特性 ， 但 是 我 们 还 是 愿意 一 起 分 享 它 ， 以 便 你 知道 这 个 功能 的 存在 。 


下 边 我 们 将 会 展示 4 个 截屏 ， 表 明 用 户 和 CGI 表单 及 脚本 的 交互 过 程 。 


在 图 20-9 中 ， 我 们 调用 friends3.py 生 成 了 一 个 熟悉 的 新 表单 页 面 。 输 入 "fool bar" > A ET 3C 
记 检 查 单 选 按 钮 。 单 击 Submit 按 钮 后 将 会 返回 错误 页 面 ， 请 看 图 20-10。 


OOA uL uu Fends COGI Dn i 


o0 © Q i ^ B © rep /Mocalhos 000/cgi-binrendss py 
Poookmmts 0 


Friends list for: NE W USER 





Your Name: foo bar 
How many friends do you have? O 0 C 10 O 25 O 50 O 100 
Submit Query 


Document: Done o rA 


图 20-9 Friends 的 初始 表单 页 面 在 MacOS X 操 作 系 统 Camino 浏 览 器 上 的 显示 
(friends3.py ) 





Qc Ò o1 E LI Np: / localhost '8000/cg.-bn fendi PY 
: i ALIA d 


ERROR 


Please select number of friends. 


f Back À 


Document: Done Əz 


& 20-10 ”Friends 的 错误 页 面 (无 效 的 用 户 输入 ) 在 Camino 浏 览 器 上 的 显示 
(Friends3.py) 
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我 们 单 击 “后退 " 按 钮 ， 选 择 "50? 单 选 按钮 ， 重 新 提交 表单 。 结 果 页 面 如 图 20-11 所 示 ， 看 起 来 很 
熟悉 ， 但 是 现在 在 页 面 底部 有 个 额外 的 连接 。 这 个 连接 将 会 把 我 们 带 到 表单 页 面 。 新 表单 页 
面 和 最 初 的 页 面 的 唯一 区 别 是 所 有 用 户 输入 的 数据 都 被 设置 成 了 "默认 值 ”， 这 意味 着 这 些 值 在 
表单 中 已 经 存在 了 。 我 们 可 以 看 图 20-12。 


e0t 9. OEE AI l AATE i EAEE =N 


Q < 30 和 3 全 d @ hup://localhost:8000/cgi- -bin/friends3.py 
Pa 5s 


Friends list for: F oo Bar 


How many friends do you have? C 0 C 10 O 25 6 50 O 100 


Document: Done © 
20-11 带 有 当前 信息 的 更 新 后 的 friends 表 单 页 面 


«6098 ii Erlends CGI Demo 


PAE AAAA AA Mr 


O G OGA m ‘© hup:/ /locaihost. 8000/cgi-bin/friends3.py 
gi Bookmarks. ur 


Friends list pa P | seti eoa OB Rae eei 


"——— w O Áo 





Your name is: Foo Bar 
Y ou have 50 friends. 


Click here to edit your data again. 


Document. Done Qo, 





20-12 friends AH m (无 效 输入 ) (friends3.py) 
这 时 用 户 可 以 更 改 任何 一 个 字段 ， 或 者 重新 提交 表单 。 


毫 无 疑问 你 会 开始 注意 到 我 们 的 表单 和 数据 已 经 变 得 复杂 多 了 ， 生 成 的 HTML 页 面 是 这 样 ， 
果 页 面 更 是 复杂 。 如 果 你 有 HTML 文 本 和 应 用 程序 的 接 入 点 的 话 ， 你 可 能 会 考虑 Bae 
HTMLgen 模 块 的 连接 ，HTMLgen 是 Python 的 一 个 扩展 模块 ， 专 用 于 生成 HTML 页 面 。 


20.6 在 CGI 中 使 用 Unicode 编 码 


在 第 6 章 中 ， 我 们 介绍 了 Unicode 字 符 串 的 使 用 。 在 6.8.5 部 分 ， 我 们 给 了 个 简单 的 例子 脚本 : 

取得 Unicode 字 符 串 ， 写 入 一 个 文件 ， 。 在 这 里 ， 我 们 将 演示 一 个 具有 Unicode 
输出 的 简单 CGI 脚本 ， 并 给 浏览 器 足够 的 提示 ， 从 而 可 以 正确 的 生成 这 些 字符 。 唯 一 的 要 求 是 
你 的 计算 机 必须 装 LOUER Lp PES DUE S CH 


为 了 看 到 Unicode 的 作用 ， 我 们 将 会 用 CGI 脚本 生成 一 个 多 语言 功能 的 Web 页 面 。 首 先 我 们 用 
Unicode 字 符 串 定义 一 些 消息 。 我 们 假设 你 的 编辑 器 只 能 输入 ASCII 编 码 。 因 此 ， 非 ASCI 编 码 
的 字符 使 用 \u 转 义 符 输入 。 实 际 上 从 文件 或 数据 库 中 也 能 读 取 这 些 消息 。 

# Greeting in English, Spanish, 

# Chinese and Japanese. 

UNICODE HELLO = u""" 

Hello! 

Nu0O0A1Hola! 

Nu4F60Nu597D! 

NXu3053Nu3093Nu306BNu3061Nu306F'! 


CO cum A T SU XCODISRE BS) PITT S 此 处 还 声明 了 消息 是 以 
UTF-8 编 码 进 行 传输 的 ， 这 点 很 重要 ， 这 样 浏览 器 才 可 以 正确 的 解释 它 。 


print 'Content-type: text/html; charset-UTF-8Nr' 
print '*r' 


120.7 简单 Unicode CGI 示例 (uniCGl.py) 


这 个 脚本 输出 到 你 Web 浏 览 器 端的 是 Unicode 字 符 串 。 


o ^ 
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$!/usr/bin/env python 


1 

2 

3 CODEC = 'UTF-8' 

4 UNICODE HELLO = u''' 

5 Hello! 

6 Nu00A1Hola! 

7 Nu4F60Nu597D! 

8 \u3053\u3093\u306B\u3061\u306F! 

9 ''' 

10 

11 print 'Content-Type: text/html; charset=%s\r' $& CODEC 
12 print Mr" 

13 print '«HTML»«HEAD^«TITLE»Unicode CGI Demo«/TITLE»«/HEAD»' 
14 print '«BODY»' 

15 print UNICODE HELLO.encode (CODEC) 

16 print 'c«/BODY»«/HTML»' 


然后 输出 真正 的 消息 。 事 先 用 string 类 的 encode() 方 法 先 将 这 个 字符 串 转 换 成 UTF-8 序 列 。 


print UNICODE HELLO.encode('UTF-8') 


例 20.7 中 显示 了 完整 的 程序 。 


如 果 你 在 你 的 浏览 器 中 运行 这 个 CGI， 你 将 会 获得 如 图 20-13 所 示 的 输出 。 


站 
Qu - Up -G E A LI ruteatostcookonhelo pr 
Hello! ;Hola! 你 好 ! ZAIT 5513! 








图 20-13 简单 的 CGI Unicode 编 码 在 Firefox 上 的 输出 (UniCGl.py) 


20.7 高 级 CGI 
现在 我 们 来 看 看 CGI 编程 的 高 级 方面 。 这 包括 cookie 的 使 用 (保存 在 客户 端的 缓存 数据 ) ， 同 


一 个 CGI 字段 的 多 重 值 和 用 multipart 表 单 实现 的 文件 上 传 。 为 了 节省 空间 ， 我 们 将 会 在 同一 个 
程序 中 向 你 展示 这 三 个 特性 。 首 先 让 我 们 看 一 下 多 次 提交 问题 。 
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20.7.1 Mulitipart 表 单 提交 和 文件 的 上 传 


目前 ，CGI 特 别 指出 只 人 允许 两 种 表单 编码 ， 即 "application/x-www-form- 
urlencoded" 和 ”multipart/form-dat"。 由 于 前 者 是 默认 的 ， 就 没有 必要 像 下 边 那 样 在 FORM 标 签 
里 声明 编码 方式 。 


«FORM enctypez"application/x-www-form-urlencoded" ...» 


但 是 对 于 multipart 表 单 ， 你 需要 像 这 样 明确 给 出 编码 : 


«FORM enctype-"multipart/form-data" ...> 


在 表单 提交 时 你 可 以 使 用 任 一 种 编码 ， 但 在 目前 上 传 的 文件 仅 能 表现 为 multipart 编 码 。 
Multipart 编 码 是 由 网 景 在 早期 开发 的 ， 但 是 已 经 被 微软 (开始 于 IE4) 和 其 他 浏览 器 采用 。 


通过 使 用 输入 文件 类 型 完成 文件 上 传 : 


<INPUT type-file name=...> 


这 个 指令 表现 为 一 个 空 的 文本 字段 ， 同 时 旁边 有 个 按钮 ， 可 以 让 你 浏览 文件 目录 系统 ， 找 到 
要 上 传 的 文件 。 在 使 用 multipart 编 码 时 ， 你 客户 端 提交 到 服务 器 端的 表单 看 起 来 会 很 像 带 有 附 
件 的 email。 同 时 还 需要 有 一 个 单独 的 编码 ， 国 为 它 还 没有 聪明 到 "通过 URL 编 码 " 的 程度 ， 尤 
其 是 对 一 个 二 进 制 文件 。 这 些 信息 仍然 会 到 达 服 务 器 ， 只 是 以 一 种 不 同 的 "封装 "形式 而 已 。 


不 论 你 使 用 的 是 默认 编码 还 是 multipart 编 码 ， AAT 同样 的 方式 来 处 理 它们 ， 在 表单 
提交 时 提供 键 和 相应 的 值 。 你 还 可 以 像 以 前 那样 通过 FieldStorage 实 例 来 访问 数据 。 


20.7.3 ”多 值 字段 


除了 上 传 文件 ， 我 们 将 会 展示 如 何 处 理 具有 多 值 的 字段 。 最 常见 的 情况 就 是 你 有 一 系列 的 复 
选 框 允 许 用 户 有 多 个 选择 。 每 个 复 选 框 都 会 标 上 相同 的 字段 名 ， 但 是 为 了 区 分 它们 ， 会 有 不 
同 的 值 与 特定 的 复 选 框 关联 。 


正如 你 所 知道 的 ， 在 表单 提交 时 ， 数 据 从 用 户 端 以 键 - 值 对 形式 发 送 到 服务 器 端 。 当 提交 不 止 

一 个 复 选 框 时 ， 就 会 有 多 个 值 对 应 同一 个 键 。 在 这 种 情况 下 ，cgi 模 块 将 会 建立 一 个 这 类 实 侦 

的 列表 ， 你 可 以 遍历 获得 所 有 的 值 ， 而 不 是 为 你 的 数据 指定 一 个 MiniFielStorage 实 例 。 总 的 
来 说 不 是 很 痛苦 。 


PE 


20.7.3 cookie 


RE c A12 dE PIT T 4$ cookie » t Rig xL cookie3t TK 3& 638 » "T VAde CA Web 
站 点 服务 器 要 求 保 存在 客户 端 (例如 浏览 器 ) 上 的 二 进 制 数据 。 


由 于 HTTP 是 一 个 "无 状态 信息 "的 协议 ， 如 你 在 本 章 最 开始 看 到 的 截图 一 样 ， 是 通过 GET 请 求 
中 的 键 值 对 来 完成 信息 从 一 个 页 面 到 另 一 个 页 面 的 传递 。 实 现 这 个 功能 的 另外 一 种 方法 如 我 
们 以 前 看 到 的 一 样 ， 是 使 用 隐藏 的 表单 铺 段 ， 如 在 后 期 friends.py 脚 本 中 对 action 变 量 的 处 
理 。 这 些 信息 必须 被 龊 入 新 生成 的 页 面 中 并 返回 给 客户 端 ， 所 以 这 些 变量 和 值 由 服务 器 来 管 
理 。 


还 有 一 种 可 以 保持 对 多 个 页 面 浏览 连续 性 的 方法 就 是 在 客户 端 保存 这 些 数据 。 这 就 是 引进 
cookie 的 原因 。 服 务 器 可 以 向 客户 端 发 送 一 个 请 求 来 保存 cookie， 而 不 必用 在 返回 的 Web 页 面 
中 嵌入 数据 的 方法 来 保持 数据 。cookie 连 接 到 最 初 的 服务 器 的 主 域 上 (这 样 一 个 服务 器 就 不 能 
设置 或 者 覆盖 其 他 服务 器 上 的 cookie) ， 并 且 有 一 定 的 生存 期 限 (因此 你 的 浏览 器 不 会 堆 满 
cookie) » 


这 两 个 属性 是 通过 有 关 数 据 条 目的 键 - 值 对 和 cookie 联 系 在 一 起 的 。cookie 还 有 一 些 其 他 的 属 
性 ， 如 域 子路 径 、cookie 安 全 传输 请 求 。 


有 了 cookie， 我 们 不 再 需要 为 了 跟踪 用 户 而 将 数据 从 一 页 传 到 另 一 页 了 。 虽 然 这 在 隐私 问题 上 
也 引发 了 大 量 的 争论 ， 多 数 Web 站 点 还 是 合理 地 使 用 了 cookie。 为 了 eu 在 客户 端 获得 
请 求 文件 前 ，Web 服 务 器 向 客户 端 发 送 "SetCookie” 头 文件 要 求 客 户 端 存储 cookie 。 


一 旦 在 客户 端 建立 了 cookie, HTTP_COOKIE 环 境 变 量 会 将 那些 cookie 自 动 放 到 请 求 中 发 送 给 
服务 器 。cookie 是 以 分 号 分 隔 的 键 值 对 存在 '。 要 访问 这 些 数据 ， 你 的 应 用 程序 就 要 多 次 拆 分 
这 些 字符 串 (也 就 是 说 ， 使 用 str.split() 或 者 手动 解析 ) 。cookie 以 分 号 (;) 分 隔 ， 每 个 键 - 值 
对 中 间 都 由 等 号 (=) 分 开 。 

Tn 一 样 ，cookie 同 样 起 源 于 网 景 ， 他 们 实现 了 cookie 并 制定 出 第 一 个 规范 并 沿用 
至 今 ， 在 下 边 的 Web 站 点 中 你 可 以 接触 这 些 文档 : 
http://www.netscape.com/newsref/std/cookie spec.html ° 


一 旦 cookie 标 准 化 以 后 ， 这 些 文档 最 终 都 被 废除 了 ， 你 可 以 从 评论 请 求 文档 〔【Request for 
Comment, RFC) 中 获得 更 多 现在 的 信息 。 现 今 发 布 的 最 新 的 cookie 的 文件 是 RFC 2109 。 


20.7.4 使 用 高 级 CGI 


现在 我 们 来 展示 CGI| 应 用 程序 advcgi.py， 它 的 代码 号 功能 和 本 章 前 部 分 讲 到 的 friends3.py 的 差 
别 不 是 很 大 。 默 认 的 第 一 页 是 用 户 填写 的 表单 ， 它 由 4 个 主要 部 分 组 成 : 用 户 设 置 cookie 字 符 
串 、 姓 名 字段 、 编 程 语言 复 选 MEJA 、 文件 提交 框 。 在 图 20-14 中 可 以 看 到 示 图 。 


图 20-15 是 在 另 一 个 浏览 器 看 到 的 表单 效果 图 ， 在 这 个 表单 中 ， 我 们 可 以 输入 自己 的 信息 ， 
图 20-16 中 给 的 样式 。 ee 览 器 中 显示 的 文字 是 不 同 的 ， 
如 “Browse...”、“Choose”、“...” 等 。 
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AAA. i i sg Q Advanced CGI Demo. ud ai UC UO das DV add SA aD, 
« » x wv? ^*^ $i » e 
Back Forwars Swp Refresh Home = AutoFill Print i 
Address 9o: 

Advanced CGI Demo Form 

My Cookie Setting 


e CPPuser = (cookie has not been set yet) 


Enter cookie value 


[| — ý (optional) 


Enter your name 
(required) 


What languages can vou program in? (at least one required) 


F Python C2 PERL E} Java © C++ O PHP C) C C) JavaScript 


Enter file to upload 





E 20-14 MacOS X 系 统 IE5 浏 览 器 中 上 传 及 填写 多 值 表单 页 
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] in/advcgi.py? A 





图 20-15 Linux 系统 Netscape4 浏 览 器 中 的 同一 个 高 级 CGI 


prs 以 mutipart 编 码 提 交 到 服务 器 端 在 服务 器 端 以 同样 的 方式 用 FieldStorage 实 例 获 
hn 。 在 我 们 的 应 用 程序 中 ， 我 们 选择 的 是 逐 行 读 取 ， 遍 
2 如 果 你 不 介意 文件 的 大 小 的 话 ， 也 可 以 一 次 读 入 整个 文件 。 


由 于 这 是 服务 器 端 第 一 次 接 到 数据 ， 这 时 ， 当 我 们 向 客户 端 返回 结果 页 面 时 ， 我 们 使 
用 ”SetCookie:" 头 文件 来 捕获 浏览 器 端的 cookie。 


在 图 20-17 中 ， 你 可 以 看 到 数据 提交 后 的 结果 展示 。 用 户 输 入 的 所 有 数据 都 可 以 在 页 面 中 显示 
出 来 。 在 最 后 对 话 框 中 指定 的 文件 也 被 上 传 到 了 服务 器 端 ， 并 显示 出 来 。 


你 也 会 注意 到 在 结果 页 面 下方 的 那个 链接 ， 它 使 用 相同 的 CGI 脚本 ， 可 以 帮 我 们 返回 表单 页 。 
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如 果 我 们 单 击 下 方 的 那个 链接 ， 没 有 任何 表单 数据 提交 给 我 们 的 脚本 ， 因 此 会 显示 一 个 表单 
页 面 。 然 而 ， 如 你 在 图 20-17 中 看 到 的 一 样 ， 所 有 的 东西 都 可 以 显示 出 来 ， 并 非 是 一 个 空 的 表 
单 ! 我 们 前 边 输入 的 信息 都 被 显示 出 来 了 ! 在 没有 表单 数据 的 情况 下 我 们 是 怎样 做 到 这 一 点 
的 呢 (将 其 隐藏 或 者 作为 URL 中 的 请 求 参数 ) ? 实际 上 秘密 是 这 些 数据 都 被 保存 在 客户 端的 
cookie 中 了 。 


用 户 的 cookie 将 用 户 输入 表单 中 的 值 都 保存 了 起 来 ， 用 户 名 、 使 用 的 语言 、 上 传 文件 的 信息 都 
会 存储 在 cookie 中 。 


,Advanced CGI Demo - Opera 


Fie Edt Yew Bookmarks Tools Help 
wv xv * »» X oi http:/flocalhost:8000/cgi-binj ad | .Doament: 08 | v. 


Advanced CGI Demo Form 






My Cookie Setting 
es CPPuser = (cookie has not been set yet) 


| Enter cookie value 
Oh look mom, a cookie (optional) 


Enter your name 
steven alistair kirk (required) 


. What languages can you program in? (at least one required) 
Y Python | PERL M^ Java || C++i: PHP V^ C | : JavaScenpt 
. Enter file to upload 


"C Acomments.txt" . Choose | 


20-16 ”高 级 CGI 提交 演示 ，Win32 系 统 Opera 8 浏览 器 


当 脚 本 检测 到 表单 没有 数据 时 ， 它 会 返回 一 个 表单 页 面 ， 但 是 在 表单 页 面 建立 前 ， 它 们 从 容 
户 端的 cookie 中 抓 取 了 数据 ( 当 用 户 在 单 击 了 那个 链接 的 时 候 将 会 自动 传 入 ) 并 且 相 应 的 将 其 
填 入 表单 中 。 因 此 当 表 单 最 终 显示 出 来 时 ， 先 前 的 输入 便 会 魔术 般 地 显示 在 用 户 面 前 (如 图 
20-18 所 示 ) 。 
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Your Uploaded Data 


Your cookie value is: Oh look mom, a cookie! 
Your name is: Steven Alistair Kirk 
You can program in the following languages: 

* Python 


* Java 
.C 


Your uploaded file... 
Name: Comments. txt 
Contents: 


COMMENTS 
Like most of its Unix sbell and script language brethren, 
You can also start a comment in the mi 


Basically, anything after the 'f' through the € 
the line vill be ignored. 


Click here to retum to form 





图 20-17 ”由 Web 服 务 器 生成 和 返回 的 结果 页 面 ，Win 32 系 统 Opera 4 浏览 器 
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Opera 40 Unregistered version - [Advanced CGI Demo) 


je ue 









= ~ 


| Advanced CGI Demo Form 





My Cookie Setting 


* CPPuser = Oh look mom, a cookie! 
| Enter cookie value 

Oh look mom, a cookie! (optional) 

Enter your name 
| [Steven Alistair Kirk (required) 


What languages can you program in? (ct least one required) 
WM Python[^ PERL Javal C [^ PHP IV CI JavaScript 


Enter file to upload 





A 20-18 通过 客户 端 cookie 载 入 数据 的 表单 页 
我 们 相信 你 现在 已 经 迫不及待 的 想 看 下 这 个 程序 了 ， 详 见 例 20.8。 


advcgi.py 和 我 们 本 章 前 部 分 提 到 的 CGI 脚本 friends3.py 相 当 像 ， 它 有 表单 页 、 结 果 页 、 错 误 页 
可 以 返回 。 新 的 脚本 中 除了 有 所 有 的 高 级 CGI 特性 外 ， 还 在 脚本 中 增加 了 更 多 的 面向 对 象 特 
AE : 用 类 和 方法 代替 了 一 系列 的 函数 。 我 们 页 面 的 HTML 文 本 对 我 们 的 类 来 说 都 是 静态 的 了 ， 
这 就 意味 着 它们 在 实例 中 都 是 以 常量 出 现 的 一 一 虽然 我 们 这 里 仅 有 一 个 实例 。 


RIT ( 逐 块 ) 解释 
1-7 


普通 的 起 始 和 模块 导入 行 出 现在 这 里 。 你 可 能 不 太 熟 悉 的 唯一 模块 是 CStringlO， 我 们 曾 在 第 
10 章 简单 讲解 过 它 并 在 例 20.1 中 用 过 。cStringlO.StinglO() 会 在 字符 串 上 创建 一 个 类 似 文件 的 
对 象 ， 所 以 访问 这 个 字符 串 与 打开 一 个 文件 并 使 用 文件 句柄 去 访问 数据 很 相似 。 


9 ~ 12 行 


在 声明 AdvCGI 类 之 后 ，header 和 url (静态) 变量 被 创建 出 来 ， 在 显示 所 有 不 同 页 面 的 方法 中 
会 用 到 这 文 此 变量 o 


14 ~ 8047 


所 有 这 个 块 中 的 代码 都 是 用 来 创建 、 显 示 表 单 页 面 的 。 那 些 数据 属性 都 是 不 言 自 明 的 。 
getCPPcookie() 取 得 Web 客 户 端 发 来 的 cookie 人 信息， 而 showForm() 校 对 所 有 这 些 信息 并 把 表 
单 页 面 返回 给 客户 端 。 


82 ~ 91 行 
这 个 代码 块 负责 错误 页 面 
93 ~ 144 行 


结果 页 面 的 生成 使 用 了 本 块 代码 。setCPPcookie() 方 法 要 求 客户 端 为 我 们 的 应 用 程序 存储 
cookie， 而 doResults() 方 法 聚集 所 有 数据 并 把 输出 发 回 客户 端 。 


例 20.8 高 级 CGI 应 用 (asvcgi.py ) 


这 个 脚本 有 一 个 处 理 所 有 事情 的 主 有 函数 ，AdvCGI， 它 有 方法 显示 表单 、 错 误 或 结果 页 面 ， 同 
时 也 可 以 从 客户 端 (Web 浏 览 器 ) 读 写 cookie 。 
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1 £!/usr/bin/env python 

2 

3 from cgi import FieldStorage 

4 from os import environ 

5 from cStringIO import StringIO 

6 from urllib import quote, unquote 

7 from string import capwords, strip, split, join 

8 

9 class AdvCGI (object): 

10 

11 header = 'Content-Type: text/htmlWMnWMn' 

12 url = '/py/advcqgi.py"' 

13 

14 formhtml = '''<HTML><HEAD><TITLE> 

15 Advanced CGI Democ/TITLE»-«/HEAD» 

16 «BODY»«H2»Advanced CGI Demo Form</H2> 

17 «FORM METHOD*post ACTIONe"&s" ENCTYPEe"multipart/form-data"» 
18 «H3»My Cookie Settingc/H3» 

19 «LI» «CODE»«B»CPPuser = $5«/B»«/CODE» 

20 «H3»Enter cookie value<BR> 

21 <INPUT NAME-cookie values"$s"» («I»optionalc«/I»)«/H3» 
22 «H3»Enter your name«BR» 

23 <INPUT NAME=person VALUEs"$s"» («I»required«/I»)«/H3» 
24 «H3»What languages can you program in? 

25 (<I>at least one required«/I»)«/H3» 

26 *s 

27 «H3»Enter file to upload «/H3» 

28 <INPUT TYPE-file NAME"upfile VALUE»"$s" SIZE-45»5 

29 «P»«INPUT TYPE-submit» 

30 «/FORM»«/BODY»-/HTML»''"' 
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31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
éi 
€2 
63 
64 
65 
66 
€? 
68 
69 
70 
71 
72 
73 
74 
75 
76 
T 


langSet = ('Phython', 'PERL', 'Java', 'Ce*', 'PHP', 
'C', JavaScript') 
langlItem = ^ 
'SINPUT TYPE-9checkbox NAME-l1ang VALUE»"$5"$5» $5sin' 


def getCPPCookies(self): # read cookies from client 
M onviron.has key('HTTP COOKIE') : 
for eachCookie Inmap(strip, V F 
splít(environ['HTTP.COOKIE'], *;*))}: 
if len(eachCookie) > 6 and ^ 
eachCcokie[:3] == 'CPP': 
tag = eachCookie[3:7] 
try: 
self.cookies[tag] = \ 
eval(iunquote (eachCookie [(8:])) 
except (NameError, SyntaxError): 
self.cookies[tag] = ^ 
unquote (eachCookie[B8:]) 
else: 
self.cookies['info'] = self.cookies['user'] = '' 


if self.cookies['info'] le '*: 
self.who, langStr, self.fn = \ 
split(self.cookies['ínfo'], ':"') 
self.langs = split(langStr, ',"') 
else: 
self.who = self.fn = ' ' 
self.langs = ['Python'] 


def showForm(self): & show fill-out form 
self.getCFPCookies() 
langStr = '' 
for eachLang in AdvCGI.langSet: 
if eachLang in self.langs: 
langStr += AdvCGI.langItem è V 
(eachLang, ' CHECKED', eachLang) 
else: 
langStr += AdvCGI.langItem & \ 
(eachLang, '', eachLang) 


if not self.cookies.has key('user') or V 
self.cookies['user'] == '': 
cookStatus = '«I»(cookíe has not been set yet)«/I»' 
userCook = '' 
else: 
userCook = cookStatus = self.cookies['user'] 
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78 
79 
B0 
81 
82 
83 
84 
85 
B6 
87 
88 
89 
90 
91 
92 
93 
94 
95 
96 
97 
98 
99 
100 
101 
102 
103 
104 
105 
106 
107 
108 
109 
110 
111 
112 
113 
114 
115 
116 
117 
118 
119 
120 
121 
122 
123 
124 
125 
126 


print AdvCGI.header + AdvCGI.formhtml * (AdvCGI.url, 
cookStatus, userCook, self.who, langStr, self.fn) 


errhtml = '''<HTML><HEAD><TITLE> 
Advanced CGI Demo«/TITLE»«/HEAD» 
«BODY»«H3»25RROR«/H3» 
«B»tsc/B»«P» 
«FORMS«INPUT TYPE»sDutton VALUEsBack 
ONCLICKs"window.history.back()"»«/FORM^ 
«/BODY^«/HTML»''' 


def showError (self): 


print AdvCGI.header + AdvCGI.errhtml % (self.error) 


reshtm] = '''«cHTML»«HEAD^«TITLE» 
Advanced CGI Demo«/TITLE»«/HEAD» 
*BODY»«H2»Your Uploaded Data«/H2» 
«H3»Your cookie value is: «B»*s«/B»«/H3» 
«H3»Your name is: «B»isc/B»«/H3» 
*H3»You can program in the following languages:«/H3» 
«UL»*sc/UL» 
«MH3»Your uploaded file...«BR» 
Name: «I»4sc/I»«BR»^ 
Contents:«/H3» 
<PRE>¢5</PRE> 
Click «A HREFe"*$2s"»«Bohere«/B»«/A» to return to form. 
«/BODY»«/WTML»''"' 


def setCPPCookies(self):4 tell client to store cookies 


for eachCookie in self.cookies.keys(]: 
print 'Set-Cookie: CPP4s-$5; pathe/' &$ A 


(eachCookie, quote(self.cookies[eachCookie])) 


def doResults(self):4 display results page 
MAXBYTES * 1024 
langlist = '' 
for eachLang in self.langs: 


langlist = langlist + '<LI>%S<BR>' 3 eachLang 


filedata = '' 

while len(filedata) < MAXBYTES:8 read file chunks 
data = self.fp.readline() 
if data == '': break 
filedata += data 

else: $ truncate if too long 
filedata += \ 


t... <B><I> (file truncated due to size]«/I»«/B»' 


self.fp.close() 
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if filedata == ''; 

filedata = \ 
<B><1I> (file upload error or file not given)«/I»«/B»' 
filename = self.fn 


' if not self.cookies.has key('user') or \ 
self.cookies['user') ee '': 
cookStatus = '«I»(cookie has not been set yet)«/I»' 
userCook = '' 
else: 
userCook = cookStatus = self.cookies['user'] 


self.cookies['info'] = join([self.who, \ 
join(self.langs, ','), filename], ':') 
self.setCPPCookies() 
print AdvCGI.header + AdvCGI.reshtml * \ 
(cookStatus, self.who, langlist, 
filename, filedata, AdvCGI.url) 


def goí(self): # determine which page to return 
self.cookies = |] 
self.error = '' 
form = FieldStorage(] 
if form.keys() == []: 
selt.showForm() 
return 


if form.has key('person'): 
self.who = capwords(strip(form['person'].value)) 
if self.who == '':; ` 
self.error = 'Your name is required. (blank)"' 
else: 
self.error = 'Your name is required. (missing)"' 


if form.has key('cockie'): 
self.cookie['user'] = unquote lstrip(\ 
form['cookie'].value)) 
elso: 
self.cookies['user'] = '' 


self. langs = [] 
if form.has key('lang'): 

langdata = form['lang'] 

if type(langdata) == type([1): 
for eachLang in langdata: 
self.langs.append(eachLang.value) 
else: 
self.langs.append(langdata.valuc) 

else: 
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176 self.error = 'At least one language required. 


178 if form.has key('upfile'): 

179 upfile = form["upfile"] 

180 self.fn = upfile.filename or '' 
181 if upfile.file: 

182 self.fp - upfile.file 

183 else: 

184 self.fp = StringIO('(no data)') 
185 else: 

186 self.fp = StringIO('(no file)") 
187 self.fn = '' 

188 

189 if not self.error: 

190 self.doResults() 

191 else: 

192 self.showError () 

193 

194 if name == ' main ' 

195 page = AdvCGI () 

196 page.go () 


doResults() 方 法 收集 所 有 数据 并 把 输出 发 回 客户 端 。 
146 ~ 196 行 


脚本 一 开始 就 实例 化 了 一 个 AdvCGI 页 面 对 象 ， 然 后 调用 它 的 go() 方 法 让 一 切 运转 起 来 ， 这 和 
严格 的 基于 过 程 编写 的 程序 不 同 。go() 方 法 中 包含 读 取 所 有 新 到 的 数据 并 决定 显示 哪个 页 面 的 
mde 


如 果 没 有 给 出 名 字 或 选 定语 言 ， 错 误 页 面 将 会 被 显示 。 如 果 没有 收 到 任何 输入 数据 ， 将 调用 
showForm() 方 法 来 输出 表单 ， 否 则 将 调用 doResults() 方 法 来 显示 结果 页 面 。 通 过 设置 
self.error 变 量 可 以 创建 错误 页 面 ， 这 样 做 有 两 个 目的 。 它 不 但 可 以 让 你 把 错误 原因 设置 在 字 
符 串 里 ， 并 且 可 以 作为 一 个 标记 表明 有 错误 发 生 。 如 果 该 变量 不 为 室 ， 用 户 将 会 被 导向 到 错 
X d) 


处 理 person 字 段 (第 154~159 行 ) 的 方法 和 我 们 先前 看 到 的 一 样 ， 一 个 键 - 值 对 ; 然而 ， 在 收 
集 语言 信息 时 却 需要 一 点 技巧 ， 原 因 是 我 们 必须 检查 一 个 (Mini) FieldStorage 对 象 或 一 个 该 
对 象 的 列表 。 我 们 将 使 用 熟悉 的 type() 内 建 函 数 来 达到 目的 。 最 终 ， 我 们 会 有 一 个 单独 或 多 个 
语言 名 的 列表 ， 具 体 依赖 于 用 户 的 选择 情况 。 


使 用 cookie (第 161~165 行 ) 来 保管 数据 展示 了 如 何 利 用 它们 来 避免 使 用 任何 类 型 的 CGI 字 
段 。 你 一 定 注 意 到 了 代码 里 包含 这 些 数 据 的 地 方 没 有 调用 CGI 处 理 ， 这 意味 着 数据 并 非 来 自 
FieldStorage 对 象 。 这 些 数据 是 由 Web 客 户 端 通过 每 一 次 请 求 和 从 cookie 取 得 的 值 (包括 用 户 


的 选择 结果 和 用 来 填充 后 续 表单 的 已 有 信息 ) 传 给 我 们 的 。 


为 ShowResults() 方 法 从 客户 那里 取得 了 新 的 收入 值 ， 所 以 它 负责 通过 调用 SetCPPcookie() 
设置 cookie。 而 showForm() 儿 须 读 出 cookie 中 的 值 才 能 用 表单 页 显示 用 户 的 当前 选项 。 这 通 
过 它 对 getCPPcookie() 的 调用 实现 。 


最 后 ， 我 们 看 看 文件 上 传 处 理 (第 178~187 行 ) 。 不 论 一 个 文件 是 否 已 经 上 传 ，FieldStorage 
都 会 从 file 属 性 中 获得 一 个 文件 句柄 。 在 第 180 行 ， 如 果 没 有 指明 文件 名 ， 那 么 我 们 只 须 把 它 
设 成 空 字 符 串 。 如 果 访 问 过 value 属 性 ， 那 么 文件 的 整个 内 容 都 会 被 放 到 value 里 。 还 有 一 个 更 
好 的 做 法 ， 你 可 以 去 访问 文件 指针 ”file 属性 一 并且 可 以 每 次 只 读 一 行 或 者 其 他 更 慢 一 些 
的 处 理 方法 。 


在 我 们 的 例子 里 ， 文 件 上 传 只 是 用 户 提 交 过 程 的 一 部 分 ， 所 以 我 们 可 以 简单 地 把 文件 指针 传 
给 doResults() 有 函数 ， 从 文件 中 抽取 数据 。 由 于 空间 限制 doResults() 将 只 显示 文件 最 前 面 1K 的 
内 容 ， 这 也 表明 显示 一 个 4M 的 二 进 制 文件 是 没 必要 (或 未 必 有 效 /有 用 ) 的 。 


20.8 Web (HTTP) 服务 器 


到 现在 为 止 ， 我 们 已 经 讨论 了 如 何 使 用 Python 建立 Web 客 户 端 并 用 CGI 请 求 处 理 帮 助 Web 服 
务 器 执行 了 一 些 工 作 。 我 们 通过 第 20.2 节 和 第 20.3 节 的 学 习 知 道 了 Python 可 以 用 来 建立 简单 
和 复杂 的 Web 客 户 端 ， 而 对 复杂 的 CGI 请 求 没有 说 明 。 


然而 ， 我 们 在 这 章 的 焦点 是 探索 建立 Web 服 务 器 。 如 果 说 Firefox、Mozila、IE、Opera、 
Netscape、AOL、Safari、Camino、Epiphany、Galeon 和 Lynx 浏 览 器 是 最 流行 的 一 些 Web 客 
户 端 ， 那 么 什么 是 最 常用 的 Web 服 务 器 呢 ? 它们 就 是 Apache、Netscape IIS、thttpd、Zeus 和 
Zope。 由 于 这 些 服 务 器 都 远 远 超 过 了 你 的 应 用 程序 要 求 ， 这 里 我 们 使 用 Python 建立 简单 但 有 
用 的 Web 服 务 器 。 


用 Python 建立 Web 服 务 器 


由 于 已 经 打算 建立 这 样 的 一 个 应 用 程序 ， 很 自然 就 需要 创建 个 人 素材 ， 但 是 你 将 要 用 到 的 所 
有 的 基础 代码 都 在 Python 的 标准 库 中 。 要 建立 一 个 Web 服 务 、 一 个 基本 的 服务 器 和 一 个 "处理 
器 "是 必 备 的 。 


基础 的 (Web) 服务 器 是 一 个 必 备 的 模具 。 它 的 角色 是 在 客户 端 和 服务 器 端 完成 必要 HTTP 交 
互 。 在 BaseHTTPServer 模 块 中 可 以 找到 一 个 名 叫 HTTPServer 的 服务 器 基本 类 


o 


处 理 器 是 一 些 处 理 主要 “VVeb 服 务 ? 的 简单 软件 。 它 们 处 理 客 户 端的 请 求 ， 并 返回 适当 的 文件 ， 
静态 的 文本 或 者 由 CG| 生 成 的 动态 文件 。 处 理 器 的 复杂 性 决定 了 你 的 Web 服 务 器 的 复杂 程度 。 
Python 标 准 库 提供 了 三 种 不 同 的 处 理 器 。 


最 基本 、 最 普通 的 是 vanilla 处 理 器 ， 被 命名 为 BaseHTTPResquestHandler， 这 个 可 以 在 基本 
Web 服 务 器 的 BaseHTTPServer 模 块 中 找到 。 除 了 获得 客户 端的 请 求 外 ， 不 再 执行 其 他 的 处 理 
工作 ， 因 此 你 必须 自己 完成 它们 ， 这 样 就 导致 了 myhttpd.py 服 务 的 出 现 。 


Jl] T SimpleHTTPServer/& +k 7 $5 SimpleHTTPRequestHandler££ + # 
BaseHTTPResdquestHandler 基 础 上 ， 直 接 执行 标准 的 GET 和 HEAD 请 求 。 这 虽然 还 不 算 完 
美 ， 但 已 经 可 以 完成 一 些 简 单 的 功能 了 。 


最 后 ， 我 们 来 看 下 用 于 CGIHTTPServer 模 块 中 的 CGIHTTPRequestHandler 处 理 器 ， 它 可 以 获 
取 SimpleHTTPRequestHandler 并 为 POST 请 求 提 供 支持 。 它 可 以 调用 CGI 脚本 完成 请 求 处 理 
过 程 ， 也 可 以 将 生成 的 HTML 脚 本 返回 给 客户 端 。 

这 三 个 模块 和 他 们 的 类 在 表 20.6 中 有 描述 。 


为 了 能 理解 在 SimpleHTTPServer 和 CGIHTTPServer 模 块 中 的 其 他 高 级 处 理 器 是 如 何 工作 
的 ， 我 们 将 对 BaseHTTPRequestHandler 实 现 简 单 的 GET 处 理 功能 。 





Æ 20.6 Web 服务 器 模块 和 类 
模 $ i£ 
BaseHTTPServer 提供 基本 的 Web INSr uu mA S. 分别 是 HTTPServer 和 
BascHTTPRequestHandler 
SimpleHTTPServer 包含 执行 GET 和 HEAD 请 求 的 SimpleHTTPRequestHandler K 
— 包含 处 理 POST 请 求 和 执行 CX CGIHTTPRequcstHandjer 类 


CGIHTTPServer 





在 例 20.9 中 ， 我 们 展示 了 一 个 Web 服 务 器 (myhttpd.py) 的 全 部 工作 代码 。 

这 个 服务 的 子 类 BaseHTTPRequestHandler 只 包含 do_GET() 方 法 ， 在 基础 服务 器 接 到 GET 请 
求 时 被 调用 。 尝 试 打开 客户 端 传 来 的 路 径 ， 如 果实 现 了 ， 将 会 返回 "OK" 状 态 (200) ， 并 转发 
下 载 的 Web 页 面 ， 否 则 将 会 返回 404 状 态 。 

main() 函 数 只 是 简单 的 将 Web 服 务 器 类 实例 化 ， 然 后 启动 它 进 ni 息 的 服务 循环 ， 如 果 过 
到 了 AC 中 断 或 者 类 似 的 键 输入 则 会 将 其 关闭 。 如 果 你 可 以 访问 并 运行 这 个 服务 器 ， 你 就 会 发 

现 它 会 显示 出 一 些 类 似 这 样 的 登录 输出 : 


# myhttpd.py 


Welcome to the machine... Press ^C once or twice to quit 

ocalhost - - [26/Aug/2000 03:01:35] "GET /index.html HTTP/1.0" 200 - 

ocalhost [26/1 j 29 C 404, me J E € F t x m 
alhost [26/A dummy. iT 1 1 
alhost [26/A htm 0" 


当然 ， 我 们 的 Web 服 务 器 实在 太 简 单 了 ， 它 甚至 还 不 能 处 理 普 通 的 文本 文件 。 我 们 将 这 部 分 
的 解决 方案 留 给 读者 研发 一 一 在 本 章 最 后 的 练习 题 中 。 


4. 


正如 你 所 看 到 的 一 样 ， 建 立 一 个 Web 服 务 器 并 在 纯 Python 脚本 中 运行 并 不 会 花 太 多 时 间 。 为 
你 的 特定 应 用 程序 定制 改进 处 理 器 将 需要 做 更 多 事情 。 请 查看 本 部 分 的 相关 库 来 获得 更 多 模 
块 及 其 类 的 信息 。 


例 20.9 简单 Web 服 务 器 (myhttpd.py ) 
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这 个 简单 的 Web 服 务 器 可 以 读 取 GET 请 求 ， 获 取 Web 页 面 (.html 文 件 ) 并 将 其 返回 


给 客户 


端 ? 它 通过 使 用 BaseHTTPServer 的 BaseHTTPRequestHandler 处 理 器 执行 do_GET() 方 法 来 
处 理 GET 请 求 。 


O 0 J CU 4 UNP 


PH oHR 
H o 


12 


$!/usr/bin/env python 


from os import curdir, sep 


from BaseHTTPServer import \ 
BaseHTTPRequestHandler, HTTPServer 


class MyHandler (BaseHTTPRequestHandler): 


def do GET (Self); 


try: 


f = open(curdir 


* sep * self.path) 


self.send response (200) 


self.send header('Content-type', 


'text/html') 


self.end headers() 


self.wfile.write(f.read()) 


f.close() 


except IOError: 


self.send error(404, 


'Fiie Not 


def main(): 


30 
3l 


32 
33 


try: 


Found: $s' $ self.path) 


server - HTTPServer(('', 80), MyHandler) 


print 'Welcome to the machine...', 


print 'Press ^C once or twice to quit.' 


server.serve forever() 


except KeyboardInterrup 


print '^C received, 


server. 
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shutting down server' 


Socket.close() 
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20.9 相关 模块 


在 表 20.7 中 ， 我 们 列 出 了 对 Web 开 发 有 用 的 模块 。 也 许 你 会 想 看 下 第 17 章 的 因特网 客户 端 编 


程 ， 还 有 第 23 章 的 Web 服 务 部 分 的 模块 ， 这 些 对 Web 应 用 都 是 很 有 用 的 。 


3 20.7 Web 编程 相关 模块 
Miet A £ 
Web 应 用 程序 
cgi 从 标准 阿 关 接口 《CGI) 获取 数据 
egitb* 处 理 CGI 返回 数据 


解析 HTML 文件 时 用 的 旧 HTML 解析 器 : HTMLParser 类 扩展 
fi sgmllib.SGMLParser 


HTML parser* Wf) AKT. SGML 的 HTML. XHTML 解析 器 
htmlentitydefs HTML $103; (de 3t 
cookic 用 于 HTTP 152511 9805/8 55 2808 cookie 
cookielib HTTP WRN) cookie At REA 
webbrowser" Mug. F1 WS 04S Web 文档 
sgmilib 解析 简单 的 SGML 文件 
robotparser 解析 robots.txt 文件 作 URL 的 “可 获得 性 ”分 析 
heatplit MERJE HTTP S ^x 
XML 解析 
xmllib 原始 的 简单 XML 解析 器 已 过 时 /不 推荐 使 用 》 
xml" 包含 许多 不 网 XML VANERNE LFE) 
xml.sax" MANER F SAX2 的 XMLLSAX) 解 析 器 
xml.dom" LAURY (DOM) 的 XML 解析 器 
xmletree" 料 型 的 XML 解析 和 器， 基于 Elemat flexible container 对 象 
xml.parsers.expat" IPREM Expat XML 解析 器 的 接口 
xmirpclib 通过 HTTP 提供 XML BMRA (RPCO ER 
XML 解析 
SimpleXMLRPCServer* Python XML-RPC /8 jr 2$ 0) Mc MAE 
DocXMLRPCServer" 自 挽 述 XML-RPC 服务 器 的 枢 菜 
Web 服务 到 
BaseHTTPServer 用 来 开发 Web 服务 器 的 掏 象 类 
SimpleHTTPServer 处 理 景 简单 的 HTTP 清 求 (HEAD 和 GET) 
PRET TE 不 但 能 像 SimpleHTTPScrvers 一 样 处 理 Web 文件 ， 还 能 处 理 


CGI WR (HTTP POST) 
wsgiref Web 服务 器 和 Python Web AA BUTI ERRED 
第 三 方 开发 伺 《〈 音 标准 岩 》 


HTMLgen 15) CGI JE Python 对 象 转换 成 可 用 的 HTML. httpz/starship, 
python.net/crew/friedriclVHTMLgen/ htmbmain html 
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续 表 
模块/ 色 A x 
— ima. 34M ANAD 
LZ 
poplib 用 来 创建 POP3 客户 并 
imaplib 用 来 创建 IMAP4 8 
邮件 、MIME 处 理 及 数据 编码 格式 









管理 e-mail 消息 的 工具 包 ， 包 括 MIME 和 其 他 基于 RFC2822 
的 消息 


e-mail 消息 的 信箱 类 
解析 mailcap 文件 ， 从 中 获得 MIME 应 用 授权 










mimetools 提供 封装 MIME 编码 信息 的 功能 
mimetypes 提供 和 MIME 类 型 相关 的 功能 
Mime Writer 生成 MIME 编码 的 多 种 文件 
multifile uf UM E dM MIME 编码 文件 
quopri MAEHE quoted-printable 规范 的 数据 
rfc$22 解析 符合 RFCRO2 标准 的 e-mail 头 信息 
smtplib 用 来 创建 SMTP 《简单 部 件 传输 协议 ) 客 户 端 
base64 38 PLE PHI base64 标准 的 数据 
binascii iR ELE] bascó4. binhex. uu (HER) 格式 的 数据 
binhex 编 解码 使 用 binbex4 标准 的 数据 
vu 编 解码 使 用 uuencode 格式 的 数据 
aps oix 
hitplib* Rx ent HTTP X P^ 
ftplib 用 来 创建 FTP(File Transfer Protocol) e f" II 
gopherlib KDE Gopher 9 ^18 
teloetlib MRE Telnet 2e P1 
nntplib HIERIE NNTP OWA hg fes8 EiX[Usenet]) WR 
a — Python l6 中 新 增 ， 
b， Python20 'P eiit. 
c Python 2.2 中 新 增 。 
d Python2.2 中 新 增 。 
e Python 2.4 中 新 增 。 
f. Python 2.5 中 新 增 。 


20.40 练习 


20-1.urllib 模 块 及 文件 。 


nt cT 
中 ， 以 后 每 次 运行 脚本 都 添加 名 字 。 附 加 题 : 增加 一 些 代码 把 这 种 文件 的 内 容 转 储 
Hsu MEET eu omes EL BS 


有 名 字 。 


20-2.urllib 模 块 。 编 写 一 个 程序 ， 它 接收 一 个 用 户 输入 的 URL (可 以 是 一 个 Web 页 面 或 一 


个 FTP 文 件 ， 例 如 ，http://python.org 或 ftp://ftp.python.org/pub/python/README) ， 然 
后 下 载 它 并 以 相同 的 文件 名 (如果 你 的 系统 不 支持 也 可 以 把 它 改 成 和 原文 件 相 似 的 名 
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Z) 存储 到 电脑 上 。Web 页 面 (HTTP) 应 保存 成 。 htm 或 。html 文 件 ， 而 FTP 文 件 应 保 
持 其 扩展 名 。 


20-3.urllib 模 块 。 重 写 例 11.4 的 grabWeb.py 脚 本 ， 它 会 下 载 一 个 Web 页 面 ， 并 显示 生成 的 
HTML 文 件 的 第 一 个 和 最 后 一 个 非 空 白 行 ， 你 应 使 用 urlopen() 来 代替 urlretrieve() 来 直接 
处 理 数据 (这样 就 不 必 先 下 载 所 有 文件 再 处 理 它 了 ) 。 


20-4.URL 和 正则 表达 式 。 你 的 浏览 器 也 许 会 保存 你 最 喜欢 的 Web 站 点 的 URL， 并 把 它们 
保存 成 "书签 "里 的 一 个 HTML 文 件 (Mozilla 衍 生 浏览 器 ) 或 是 ”收藏 夹 " 中 的 一 组 URL 文 件 
(IE) 。 找 出 你 浏览 器 记录 ”热门 链接 "的 方法 ， 并 找 出 其 所 在 和 存储 方式 。 不 去 更 改 任 何 
文件 ， 别 除 对 应 Web 站 点 (如果 给 定 了 的 话 ) 的 URL 和 名 字 ， 生 成 一 个 以 名 字 和 链接 作 
为 输出 的 双 列 列表 ， 并 把 这 些 数据 保存 到 硬盘 文件 中 。 截 取 站 点 名 和 URL ， 确 保 每 一 行 
的 输出 不 超过 80 个 字符 。 


20-5.URL、urllib 模 块 、 异 常 、 已 编码 正则 表达 式 。 作 为 对 上 一 个 问题 的 延伸 ， 给 你 的 脚 
本 增加 代码 来 测试 你 所 喜欢 的 链接 。 记 录 无 效 链接 (及 其 名 字 ) ， 包 括 无 效 的 Web 站 点 
和 已 经 被 删除 的 Web 页 面 。 只 输出 并 在 磁盘 中 保存 依然 有 效 的 链接 。 


20-6. 错 误 检测 。friends3.py 脚 本 在 没有 选择 任意 一 个 单 选 按 钮 指定 好 友 的 数目 时 会 返回 
一 个 错误 提示 。 在 更 新 CGI 脚 本 时 如 果 没 有 输入 名 字 (例如 空 字符 或 空白 ) 也 会 返回 一 个 
HIR o 附加 题 : 目前 为 止 我 们 探讨 的 仅 是 服务 器 端的 错误 检测 。 研 究 JavaScript 编 程 ， 并 

创建 JavaScript 代 码 来 同时 检测 错误 ， 以 确保 这 些 错误 在 到 达 服 务 器 前 被 终止 ， 这 样 
Bx 客户 端 错 误 检 测 。 下 面 的 问题 20-7~ 问 题 20-10 涉 及 VWeb 服 务 器 的 访问 日 志文 件 
和 正则 表达 式 。Web 服 务 器 (及 其 管理 员 ) 通常 需要 保存 访问 日 志文 件 (一 般 是 主 Web 
的 server 文 件 夹 里 的 logs/access_log) 来 跟踪 文件 请 求 。 一 段 时 间 之 后 ， 这 些 逐 渐变 大 
的 文件 需要 被 保存 或 删节 。 为 什么 不 能 仅 保存 有 用 的 信息 而 删除 这 些 文件 来 节省 磁盘 空 
间 呢 ?通过 下 面 的 习题 ， 你 会 练习 正则 表达 式 和 如 何 使 用 它们 进行 归档 及 分 析 Web 服 务 
器 数据 。 


20-7. 计 算 日 志文 件 中 有 多 少 种 请 求 (GET vs POST) 。 


20-8. 计 算 成 功 下 载 的 页 面 /数据 : 显示 所 有 返回 值 为 200 (OK (没有 错误 发 生 ) ) 的 链 
接 ， 以 及 每 个 链接 被 访问 的 次 数 。 


20-9. 计 算 错误 : 显示 所 有 产生 错误 的 链接 (返回 值 为 400 或 500) 以 及 每 个 链接 被 访问 的 
次 数 。 


20-10. 跟 踪 IP 地 址 : 对 每 个 |P 地 址 ' 输 出 每 个 页 面 /数据 下 载 情况 的 列表 ， 以 及 这 些 链接 被 
访问 的 次 数 。 


n E NU" 由 表单 获得 用 户 反 馈 ， 在 脚本 中 
处 理 数据 ， 最 后 返回 一 个 "感谢 ?页 
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20-12. Ž CGI - 创建 一 个 Web 客 户 泪 。 接 受用 户 输入 的 名 字 、 电 子 邮 件 地 址 、 日 志 ， 并 
将 其 保存 到 文件 中 ( 自 定义 格式 ) 。 类 似 上 一 个 题 ， 返回 一 个 "感谢 你 对 本 页 的 填写 ”页 
面 。 同 时 再 给 用 户 提 供 一 个 查看 客户 簿 的 链接 。 


20-13.Web 浏 览 器 Cookie 和 Web 站 点 注册 。 更 改 你 对 习题 20-4 的 答案 。 你 现在 可 以 使 用 
用 户 名 -密码 信息 来 注册 Web 站 点 ， 而 不 必 只 用 简单 的 基于 文本 的 菜单 系统 。 附 加 题 : 想 
办 法 让 自己 熟悉 Web 浏 览 器 cookie， 并 在 最 后 登录 成 功 后 将 会 话 保持 4 个 小 时 。 


20-14.Web € P 35 » 4$ 18 0120.19 Web/fe $ Sip A crawler.py > 4# f] HTMLParserd& J& X 
BeautifulSoup APT A 4t » 


20-15. 错 误 处 理 。 当 一 个 CGI 脚本 前 溃 时 会 发 生 什 么 ? 如 何 用 cgitb 模 块 提 供 帮 助 ? 


20-16.CGI、 文 件 升级 及 Zip 文 件 。 创 建 一 个 不 仅 能 保存 文件 到 服务 器 磁盘 ， 而 且 能 智和 
解压 Zip 文 件 (或 其 他 压缩 档 ) 到 同名 子 文 件 夹 的 CGI 应 用 程序 。 


20-17.Zope、Plone、TurboGears 及 Django。 研 究 每 一 个 复杂 的 Web 开 发 平台 并 分 别 创 
建 一 个 简单 的 应 用 程序 。 


20-18.Web 数 据 库 应 用 程序 。 思 考 对 你 Web 数 据 库 应 用 程序 支持 的 数据 库 构 架 。 对 于 多 
用 户 的 应 用 程序 ， 你 需要 支持 每 个 用 户 对 数据 库 的 全 部 内 容 的 访问 ， 但 每 个 人 可 能 分 别 
输入 。 一 个 例子 就 是 你 家 人 及 亲属 的 ”地址 簿 ”。 每 个 成 员 成 功 登 录 后 ， 显 示 出 来 的 页 面 应 
该 有 几 个 选项 "添加 条 目 ”、" 查 看 我 的 条 目 *"、" 更 新 条 目 ”*"、” 移 动 或 删除 条 目 ” 以 及 "查看 所 
有 条 目 ”。 


20-19. 电 子 商务 引擎 。 使 用 你 在 习题 13-11 中 建立 的 类 ， 增 加 一 些 产 品 清单 建立 一 个 电子 
商务 Web 站 点 。 确 保 你 的 应 用 程序 支持 多 个 用 户 ， 机 器 每 个 用 户 的 注册 功能 。 


20-20. J PAEA 关 。 正 如 你 所 知道 的 ，cgi.FieldStorage() 方 法 返回 一 个 字典 类 对 
象 ， 包 括 提 交 的 CGI 变量 的 键 值 对 。 你 可 以 使 用 这 个 对 象 的 keys() 和 has_key() 方 法 。 在 
Python1.5 中 ，get() 方 法 被 添加 到 字典 中 ， 用 它 可 以 返回 给 定 键 的 值 ， 当 键 不 存在 时 返回 
一 个 默认 值 。FieldStorage 对 象 却 没 有 这 个 方法 。 让 我 们 依照 用 户 手册 的 形式 : 


form = cgi.FieldStorage() 


为 cgi.py 中 类 的 定义 添加 一 个 类 似 的 get() 方 法 〈 你 可 以 把 它 重 命名 为 mycgi.py 或 其 他 你 喜欢 的 
名 字 ) ， 以 便 能 像 下 面 这 样 操作 : 
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if form.has key ('who') 
who = form['who'].value 
else: 
who = ' (no name submitted) 
... 也 可 以 用 一 行 实现 ， 这 样 就 更 像 字 典 的 形式 了 : 
howmany = form.get ('who', ' (no name submitted) ') 


20-21. 高 级 Web 客 户 端 ? 在 20.7 小 节 中 的 myhttpd.py 代 码 只 能 读 取 HTML 文 件 并 将 其 
到 客户 端 。 添加 对 以 ”.txtf* 结 束 的 普通 的 文本 的 支持 。 确 保 返 回 正确 的 "text/plain” de 
MIME 类 。 附 加 题 : 添加 对 以 ”jpg" 及 ”jpeg”" 结 束 的 JPEG 文 件 的 支持 ， 并 返 

回 "image/jpeg” 的 MIME 类 型 。 


20-22. 高 级 Web 客 户 端 。 作 为 crawl.py 的 输入 的 URL 儿 须 是 以 "http://" 协 议 指示 符 开 头 ， 高 

层 的 URL 必 须 包 含 一 个 反 斜 线 ， 例 如 : http://www.prenhallprofessional.com/。 加 强 

crawl.py 的 功能 ， 允 许 用 户 只 输入 主机 名 (没有 协议 部 分 [确保 是 HTTP]) ， 反 斜 线 是 可 
选 的 。 例 如 : www.prenhallprofessional.com 应 该 是 可 接受 的 输入 形式 。 


20-23. 3 /A Web € P 3« ° 更 改 20.3 小 节 中 的 crawl.py 脚 本 ， 让 它 也 下 载 "ftp:”" 型 的 链接 。 所 
有 的 “mailto:" 都 会 被 crawl.py 忽 略 。 增 加 代码 确保 它 也 忽 
telnet?” ` "news:" ` "gopher:"fe"about:" 7! 55 &E1£ o 


20-24. 高 级 Web 客 户 端 。20.3 小 节 中 的 crawl.py 脚 本 仅 从 相同 站 点 内 的 Web 页 面 中 找到 链 
接 ， 下 载 了 。html 文 件 ， 却 不 处 理 /保存 图 片 这 类 对 页 面 同 样 有 意义 的 "文件 ”。 对 于 那些 
允许 URL 缺 少 末 端 斜 线 (/) 的 服务 器 ， 这 个 脚本 也 不 能 处 理 。 给 crawl.py 增 添 两 个 类 来 
解决 这 些 问 题 。 


一 个 是 urllib.FancyURLOpener 类 的 子 类 My404UrlOpener， 它 仅 包 含 一 个 方法 ， 
http error. 404()， 用 该 方法 来 判断 收 到 的 404 错 误 中 是 不 是 包含 缺少 末端 斜 线 的 
URL。 如 果 有 ， 它 就 添加 斜 线 并 重新 请 求 ( 仅 一 次 ) 。 如 果 仍 然 失败 ， 才 返回 一 个 
丨 正 的 404 错 误 。 你 必须 用 该 类 的 一 个 实例 来 设置 urllib.， urlopener， 这 样 urllib 才 能 
使 用 它 。 


创建 另 一 个 类 LinklmageParser， 它 派生 自 htmllib.HTMLParser。 这 个 类 应 有 一 个 构 
造 器 用 来 调用 基 类 的 构造 器 ， 并 且 初 始 化 一 个 列表 用 ee 页 面 中 解析 出 的 
图 片 文件 。 应 重 写 handle ee ， 把 图 片 文件 名 添加 到 图 片 列表 中 (这样 就 
不 会 像 现在 的 基 类 方法 那样 丢弃 它们 了 ) 。 
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+ 数据 库 和 Python， 以 及 Python 的 RDBMS、ORM 
e 数据 库 应 用 程序 程序 员 接 口 (DB-API) 

e 关系 型 数据 库 (RDBM) 

+ 对 象 -关系 管理 器 (ORM ) 

e. 相关 模块 

e 练习 


本 章 的 主题 是 如 何 通过 Python 访问 数据 库 。 前 面 我 们 已 经 了 解 了 简单 持久 存储 ， 但 是 在 更 多 
场合 下 ， 我 们 的 应 用 程序 需要 的 是 一 个 功能 齐全 的 关系 型 数据 库 (Relational Database 
Management System > RDBMS) 。 


21.1 介绍 


21.1.1. &A 


在 任何 的 应 用 程序 中 ， 都 需要 持久 存储 。 一 般 说 来 ， 有 三 种 基本 的 存储 机 制 : 文件 、 关 系 型 
数据 库 或 其 他 的 一 些 变种 ， 例 如 现 有 系统 的 API、ORM、 文 件 管理 器 、 电 子 表格 、 配 置 文件 


A 


Xo 


在 前 面 的 章节 中 ， 我 们 研究 了 通过 基于 常规 文件 的 Python 和 DBM 接 口 来 实现 持久 存储 、 比 如 
*dbm、dbhas/bsddb 文 件 、helve (pickle 和 DBM 的 结合 ) 。 这 些 接口 都 提供 了 类 似 字 典 的 对 
象 接口 。 本 章 的 主题 是 如 何在 中 大 型 项 目 中 使 用 关系 型 数据 库 (对 这 些 项 目 而 言 ， 那 些 接口 
力不从心 ) 。 


21.1.2 基本 的 数据 库 操作 和 SQL 语 言 


在 深入 主题 之 前 ， 下 面 先 简单 介绍 一 下 基本 的 数据 库 概念 和 结构 化 查询 语言 (Structured 
QueryLanguage, SQL) 。 如 果 你 有 足够 的 经 验 ， 可 以 跳 过 ， 也 可 以 通过 阅读 正文 来 复习 一 
TFs 


1. 底 层 存储 


数据 库 的 底层 存储 通常 使 用 文件 系统 ， 它 可 以 是 普通 操作 系统 文件 、 专 用 操作 系统 文件 ， 其 
至 有 可 能 是 磁盘 分 区 。 

2. 用 户 界 面 

大 部 分 的 数据 库 系统 会 提供 一 个 命令 行 工具 来 执行 SQL 命令 和 查询 ， 当 然 也 有 一 些 使 用 图 形 
界面 的 漂 漂 亮 亮 的 客户 端 程序 来 干 同样 的 事 。 

3. 数 据 库 

关系 型 数据 库 管 理 系统 通常 通常 都 支持 多 个 数据 库 ， 例 如 销售 库 、 市 场 库 、 客 户 支持 库 等 。 
如 果 你 使 用 的 关系 数据 库 管 理 系统 是 基于 服务 器 的 ， 这 些 数 据 库 就 都 在 同一 台 服 务 器 上 (一 
些 简 单 的 关系 型 数据 库 没 有 服务 器 ， 如 sqlite) 。 本 章 的 例子 中 ，MySQL 是 一 种 基于 服务 器 的 
关系 数据 库 管 理 系 统 (只 要 服务 器 在 运行 ， 它 就 一 直 在 等 待 运行 指令 ) ,SQLite 和 Gadfly 则 是 
另 一 种 轻 量 型 的 基于 文件 的 关系 数据 库 (它们 没有 服务 器 ) 。 

4. 组 件 

你 可 以 将 数据 库存 储 想 像 为 一 个 表格 ， 每 行 数据 都 有 一 个 或 多 个 字段 对 应 着 数据 库 中 的 列 。 
每 个 表 每 个 列 及 其 数据 类 型 的 集合 构成 数据 库 结构 的 定义 。 数 据 库 能 够 被 创建 ， 也 可 以 被 删 
除 ， 表 也 一 样 。 往 数据 库 里 增加 一 条 记录 称 为 插入 (inserting). ， 修 改 库 中 一 条 已 有 的 记录 则 
称 为 更 新 (updating) .， 删 除 表 中 已 经 有 的 数据 行 称 为 删除 (deleting) 。 这 些 操作 通常 作为 
数据 库 操作 命令 来 提交 。 从 一 个 数据 库 中 请 求 符合 条 件 的 数据 称 为 查询 (querying) 。 当 你 对 
一 个 数据 库 进 行 查 询 时 ， 你 可 以 一 步 取 回 所 有 符合 条 件 的 数据 ， 也 可 以 循环 逐条 取出 每 一 
行 。 有 些 数 据 库 使 用 游标 的 概念 来 表示 SQL 命令 、 查 询 、 取 回 结果 集 等 。 

5. SQL 

数据 库 命 令 和 查询 操作 需要 通过 SQL 语句 来 执行 ， 不 是 所 有 的 数据 库 都 使 用 SQL， 但 所 有 主 
流 的 关系 型 数据 库 都 使 用 SQL。 下 面 是 一 些 SQL 命 令 的 例子 ， 绝 大 多 数 数据 库 被 配置 为 大 小 
写 不 敏感 ， 除 了 数据 库 操 作 命 令 以 外 。 被 广 为 接 受 的 书写 SQL 的 基本 风格 是 关键 字 大 写 。 绝 
大 多 数 命令 行程 序 要 求 用 一 个 分 号 来 结束 一 条 SQL 语句 。 


(1) 创建 数据 库 


UPDATE users SET prid-4 WHERE prid-2; 
UPDATE users SET prid-1 WHERE uid-311; 

第 一 行 创建 一 个 名 为 "est" 的 数据 库 ， 第 二 行将 该 数据 库 的 权限 赋 给 具体 用 户 (或 者 全 部 用 
PO) ， 以 便 它们 可 以 执行 下 面 的 数据 库 操作 。 

(2) 选择 要 使 用 的 数据 库 


USE test; 


USE test; 


如 果 在 登录 数据 库 时 没有 指定 要 使 用 那个 数据 库 ， 这 条 简单 的 语句 就 可 以 指定 你 打算 访问 的 
数据 库 。 


(3) 删除 数据 库 


DROP DATABASE test; 


这 条 短 短 的 语句 具有 极 大 的 威力 ， 它 用 来 删除 数据 库 ( 包括 数据 库 中 所 有 的 表 及 表 中 的 数 
W) 。 在 输入 完 这 条 语句 按 下 回 车 之 前 ， 好 好 想 想 你 是 否 丨 的 打算 这 么 做 。 


(4) 创建 表 

CREATE TABLE users (login VARCHAR(8), uid INT, prid INT); 
这 个 语句 用 于 创建 表 users， 它 有 一 个 类 型 为 字符 串 的 列 login 和 两 个 类 型 为 整 型 的 字段 uid 和 
prid ° 

(5) 删除 表 


DROP TABLE users; 


这 个 简单 的 语句 删除 数据 库 中 的 一 个 表 和 它 的 所 有 数据 。 


(6) 插入 行 


INSERT INTO users VALUES ('leanna', 311, 1); 


INSERT 语 名 用 来 向 数据 库 中 添加 新 的 数据 行 。 语 多 中 必须 指定 要 插入 的 表 及 该 表 中 各 个 字段 
的 值 。 上 例 中 ， 表 名 是 users， 字 符 串 leanna' 对 应 着 login 字 段 ，311 和 1 分 别 对 应 着 id 和 
prid ° 


(7) 更 新 行 


UPDATE users SET prid-4 WHERE prid-2; 
UPDATE users SET prid-1 WHERE uid-311; 


UPDATE 语 多 用 来 改变 数据 库 中 的 已 有 记录 。 使 用 SET 关键 字 来 指定 你 要 修改 的 字段 及 新 值 ， 
你 可 以 指定 条 件 来 第 选 出 需要 更 新 的 记录 。 在 第 一 个 例子 中 ， 所 有 prid 字 段 值 为 2 的 记录 ， 其 
prid 字 段 的 值 都 变更 为 4。 在 第 二 个 例子 里 ，uid 字 段 值 为 311 的 用 户 ， 其 prid 字 段 的 新 值 被 置 为 
1° 


(8) 删除 行 


DELETE FROM users WHERE prid=%d; 
DELETE FROM users; 


DELETE FROM 命令 用 来 删除 数据 。 必 须 指 定 你 要 删除 的 数据 所 在 表 名 ， 如 果 未 提供 (T3 
的 ) 筛选 条 件 ， 就 像 第 二 个 例子 一 样 ， 表 中 所 有 的 数据 都 会 被 删除 。 


现在 你 已 经 了 解数 据 库 的 基本 概念 ， 有 了 这 些 基础 ， 本 章 余 下 的 部 分 学 起 来 会 更 加 容易 。 如 
果 需 要 进一步 了 解数 据 库 知识 ， 市 面 上 有 数 不 清 的 数据 库 书籍 可 供 选择 。 


21.1.3 ”数据 库 和 Python 


下 面 我 们 要 详细 了 解 Python 数 据 库 APl。Python 能 够 直接 通过 数据 库 接口 ， 也 可 以 通过 
ORM (不 需要 自己 书写 SQL) 来 访问 关系 数据 库 。 


关于 数据 库 原理 、 并 发 能 力 、 视 图 、 原 子 性 、 数 据 完 整 性 、 数 据 可 恢复 性 、 左 连接 、 触 发 
器 、 查 询 优 化 、 事 务 支持 及 存储 过 程 等 主题 ，( 市 面 上 ) 有 数 不 清 的 资源 可 供 参 者 。 本 章 不 
讨论 这 些 主题 ， 我 们 将 从 一 个 Python 应 用 程序 开始 ， 了 解 在 Python 框 架 下 如 何 将 数据 保存 到 
数据 库 ， 如 何 将 数据 从 数据 库 中 取出 来 。 之 后 你 就 可 以 决定 哪 种 方式 适用 于 你 手头 的 项 目 。 
通过 学 习 示 例 代 码 ， 你 可 以 立刻 动手 把 某 种 数据 库 整 合 到 你 的 Python 应 用 程序 当中 。 


在 Python 世界 里 ， 无 需 怀 疑 ， 与 数据 库 协 同 工 作 已 经 几乎 是 所 有 应 用 程序 的 核心 部 分 了 。 在 
本 章 中 ， 我 们 将 不 仅仅 使 用 "万 能 ”的 Python 标准 库 ， 尽 管 我 们 需要 从 标准 库 开 始 。 


作为 一 个 软件 工程 师 ， 在 你 的 职业 生涯 中 ， 你 可 能 永远 不 需要 学 习 数 据 库 知识 : 如 何 使 用 命 
令 行 工 具 、 如 何 使 用 SQL、 如 何 添加 和 更 新 数据 等 。 但 是 如 果 Python 是 你 的 编程 工具 ， 那 么 
aaa olin od d A M d 

API， 然 后 给 出 使 用 这 个 标准 的 例子 

我 们 的 例子 会 使 用 开源 的 数据 库 系 统 。 不 过 我 们 不 会 去 讨论 是 开源 产品 还 是 商业 产品 更 好 。 


要 适应 其 他 的 数据 库 也 相当 容易 ， 需 要 特别 提 到 的 是 亚 伦 : 沃 特 (Aaron Watter) 的 Gadfly 数 
据 库 ， 一 个 完全 由 Python 代码 写成 的 数据 库 系 统 。 


从 Python 中 访问 数据 库 需 要 接口 程序 ， 接 口 程序 是 一 个 Python 模块 ， 它 提供 数据 库 客 户 端 库 
(通常 是 C 语 言 写成 的 ) 的 接口 供 你 访问 。 需 要 提 到 一 点 ， 所 有 Python 接口 程序 都 一 定 程度 上 
遵守 PythonDB-API 规 范 ， 这 也 是 本 章 的 第 一 个 主要 主题 。 


图 21-1 演 绎 了 Python 数据 库 应 用 程序 的 结构 (包括 使 用 和 不 使 用 DRM ) 。 你 可 以 看 到 DB-API 
是 数据 库 客户 端 C 库 的 接口 。 










Python 应 用 程序 
Python 应 用 程序 CP Rcs TEE SQL) 
CKA SOLO [ 















应 用 程序 
CK SQL) Python ORM 
Python DB 接口 程序 Python DB 接口 程序 
RDBMS 客户 端 库 RDBMS 7 35 He RDBMS 客户 端 库 
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图 21-1 数据 库 和 应 用 程序 之 间 的 多 层 通讯 
第 一 个 框 中 一 般 是 C/C++ 程 序 ， 你 的 程序 通过 DB-API 兼 容 接口 程序 访问 数据 库 。 


ORM 通 过 程序 处 理 数据 库 细 节 来 简化 数据 库 开 发 。 


21.2 ”Python 数据 库 应 用 程序 程序 员 接 口 (DB-API) 


去 哪儿 找 一 个 合适 的 接口 访问 数据 库 ? 很 简单 ， 去 python.org 找 到 数据 库 主 题 那 一 节 ， 你 会 发 
现 所 有 支持 DB-API 2.0 的 各 种 数据 库 模 块 、 文 档 、SIG 等 。 从 那 时 起 ，DB-API 被 移 到 PEP 
249 中 〈 这 个 PEP 废 弃 了 老 的 DB-API 1.0， 也 就 是 PEP248 标 准 ) 。 那 么 ， 什 么 是 DB-API? 


DB-API 是 一 个 规范 。 它 定义 了 一 系列 必需 的 对 象 和 数据 库存 取 方 式 ， 以 便 为 各 种 各 样 的 底层 
数据 库 系 统 和 多 种 多 样 的 数据 库 接口 程序 提供 一 致 的 访问 接口 。 像 绝 大 多 数 社 区 成 果 一 样 ， 
这 个 API 的 产生 来 自 于 强烈 的 需求 。 


在 过 去 ， 不 同 的 人 为 各 种 各 样 的 数据 库 实现 了 各 种 各 样 的 数据 库 接口 程序 。 同 一 个 轮子 被 不 
同 的 人 一 遍 又 一 遍地 重复 发 明 。 这 些 接口 由 不 同 的 人 在 不 同 的 时 间 实 现 ， 功 能 接口 各 不 兼 
容 ， 这 意味 着 使 用 这 些 接口 的 程序 必须 自 定 义 他 们 选择 的 接口 模块 。 当 这 个 接口 模块 变化 
时 ， 应 用 程序 的 代码 也 必须 随 之 更 新 。 


一 个 处 理 Python 数 据 库 事务 的 特殊 事物 小 组 〈special interest group, SIG) 因此 诞生 ， 最 后 
DB-API1.0 问 世 。DB-API 为 不 同 的 数据 库 提供 了 一 致 的 访问 接口 ， 在 不 同 的 数据 库 之 间 移 植 
代码 成 为 一 件 轻 松 的 事情 (一 般 来 说 ， 只 修 要 修改 几 行 代码 ) 。 接 下 来 你 会 看 到 这 样 的 例 

E 


21.2.1 模块 属性 


DB-API 规 范 里 的 以 下 特性 和 属 
定义 的 所 有 全 局 属性 。 


隆 必 须 提供 。 一 个 DB-API 兼 容 的 模块 必须 定义 如 下 ， 表 21.1 中 



































X 21.1 DB-API 模块 属性 
Won 书 | iè f 
apilevel | 模块 兼容 的 DB-API 版 本 与 
i threadsafety u | 线程 安全 级 刘 
mm — » — 

paramstyle imi v wi 的 SQ! CROES Et] 
connect) 连 iè am 

E Add (参见 表 21.4) 

1. 数 据 属 性 
(1) apilevel 


apilevel 这 个 字符 串 〈 不 是 浮 点 型 ) 表示 这 个 DB-API 模 块 所 兼容 的 DB-API 最 高 版 本 号 。 
如 “1.0”，"2.0” 等 。 如 果 未 定义 ， 则 默认 是 “1.0”。 


(2) Threadsafety 
这 是 一 个 整 型 ， 取 值 范围 如 下 : 
e 0 : 不 支持 线程 安全 ， 多 个 线程 不 能 共享 此 模块 
e 1: 初级 线程 安全 支持 : 线程 可 以 共享 模块 ， 但 不 能 共享 连接 
e 2: 中 级 线程 安全 支持 : 线程 可 以 共享 模块 和 连接， 但 不 能 共享 游标 
e 3 : 完全 线程 安全 支持 : 线程 可 以 共享 模块 、 连 接 及 游标 


如 果 一 个 资源 被 共享 ， 就 必需 使 用 自 旋 锁 或 者 是 信号 量 这 样 的 同步 原 语 对 其 进行 原子 目标 锁 
定 。 对 这 个 目标 来 说 ， 磁 盘 文 件 和 全 局 变量 都 不 可 靠 ， 并 且 有 可 能 妨碍 mutex (AFE) 的 操 
» 。 请 参阅 threading 模 块 或 第 16 章 (多 线程 编程 ) 来 了 解 如 何 使 用 锁 。 


(3) Paramstyle 


DB-API 支 持 多 种 方式 的 SQL 参 数 风 格 。 这 个 参数 是 一 个 字符 串 ， 表 明 SQL 语 句 中 字符 囊 赫 代 
的 方式 。 (参阅 表 21.2) 








表 21.2 数据 库 参 数 风格 
参数 风格 "n it P 8 
ian (数字 ) — | 数字 位 置 风格 | WHERE name--l 
named 《命名 ) = ”命名 参数 风格 | WHERE name~:name 
pyformat | 学 典 格 式 转换 WHERE name=S namc)s 
qmark (i958) | o) V WHERE name=? 


format 





2. 函 数 属 性 


bt ANSI C 6t 


connect 方 法 生成 一 个 connect 对 象 ， 我 们 通过 


S: 3iconnectz 7 » 21.37] di f connect() £& 





WHERE name=%s 


这 个 对 象 来 访问 数据 库 。 符 合 标准 的 模块 都 会 
数 的 参数 。 
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表 21.3 connect "函数 参数 
$ WX A x 
user Usemame 
password Password 
host Hostname 
database Database name 
dsn Data source name 


数据 库 连 接 参数 可 以 以 一 个 DSN 字 符 串 的 形式 提供 ， 也 可 以 以 多 个 位 置 相 关 参 数 的 形式 提供 
(如 果 你 明确 知道 参数 的 顺序 的 话 ) ， 也 可 以 以 关键 字 参 数 的 形式 提供 。 下 面 是 一 个 来 自 
PEP 249 的 使 用 connect() 的 例子 : 


connect (dsn='myhost: MYDB',user-'guido',password-'234$') 


使 用 DSN 字 符 串 还 是 独立 参数 ? 这 要 看 你 连接 的 是 哪 种 数据 库 。 举 例 来 说 ， 如 果 你 使 用 类 似 
ODBC 或 JDBC 的 API， 你 就 应 该 使 用 DSN 字 符 串 。 如 果 你 直接 访问 数据 库 ， 你 就 会 更 倾向 于 
使 用 独立 参数 。 另 一 个 使 用 独立 参数 的 原因 是 ， 很 多 数据 库 接口 程序 还 不 支持 DSN 参 数 。 下 
面 是 一 个 非 DSN 的 例子 。 


connect() 调 用 。 注 意 不 是 所 有 的 接口 程序 都 是 严格 按照 规范 实现 的 。MySQLdb 就 使 用 了 db 参 
数 而 不 是 规范 推荐 的 database 参 数 来 表示 要 访问 的 数据 库 。 


e MySQLdb.connect(host-'dbserv', db-'inv', user-'smith') 
e PgSQL.connect (database-'sales') 

e psycopg.connect(database-'templatel', user-'pgsql') 

e gadfly.dbapi20.connect('csrDB', '/usr/local/database') 


e sqlite3.connect('marketing/test') 
3. 异 常 


兼容 标准 的 模块 也 应 该 提供 这 些 措 常 类 。 见 表 21.4。 表 21.4 DB-API| 弄 常 类 











214 DB-API 异常 类 
» 党 mo i£ 
Warning FARR 
Ero MIRER 
InterfaccError gus vow 
DutabascError mun 
DataError 修理 数据 对 出 铺 
OperationalError guod ee 
IntegrityError Summum 
InternalError 数据 库 内 部 出 错 
ProgrammingError SQL itr AK 
NotSupportedError AE ERIE CN 008 f 


21.2.2 ”连接 对 象 
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要 与 数据 库 进行 通信 ， 必 须 先 和 数据 库 建 立 
服务 器 接收 数据 等 基础 功能 。 连 接 (或 一 个 
求 ， 得 到 响应 。 


连接 。 连 接 对 象 处 理 将 命令 送 往 服务 器 ， 以 及 从 
连接 池 ) 成 功 后 你 就 能 够 向 数据 库 服务 器 发 送 请 
方法 


连接 对 象 没有 必须 定义 的 数据 属性 ， 但 是 它 至 少 应 该 定义 表 21.5 中 的 这 些 方法 。 


表 21.5 connection 对 象 方法 




















x: | - 
commit ) 提交 当前 事务 
— a - Bae Š - 
rollbackt) 取消 当前 事务 
$ 
cursor) te nx nre rg on 3 e] — 1 a s 6$. 
- 4 
errorhandler (cxn,cur, errcis, errval) 作为 已 给 荔 标 的 句柄 


一 旦 执行 了 close() 方 法 ， 再 试图 使 用 连接 对 象 的 方法 将 会 导致 异常 。 


对 不 支持 事务 的 数据 库 ， 或 者 虽然 支持 事务 但 设置 了 自动 提交 (auto-commit) 的 数据 库 系 统 
来 说，commit() 方 法 什么 也 不 做 。 如 果 你 确实 需要 ， 可 以 实现 一 个 自 定 义 方 法 来 关闭 自动 提交 
行为 。 由 于 DB-API 和 要求 必须 实现 此 方法 ， 所 以 对 那些 没有 事务 概念 的 数据 库 来 说 ， 这 个 方法 
只 需要 有 一 条 pass 语 名 就 可 以 了 。 


类 似 commit()、rollback() 方 法 仅 对 支持 事务 的 数据 库 有 意义 。 执 行 完 rollback()， 数 据 库 将 恢 
复 到 提交 事务 前 的 状态 。 根 据 PEP249， 在 提交 commit() 之 前 关闭 数据 库 连 接 将 会 自动 调用 
rollback() 方 法 。 


对 不 支持 游标 的 数据 库 来 说 ，cursor() 方 法 仍然 会 返回 一 个 尽量 模仿 游标 对 象 的 对 象 。 这 是 最 
低 要 求 。 特 定数 据 库 接口 程序 的 开发 者 可 以 任意 为 他 们 的 接口 程序 添加 额外 的 属性 ， 只 要 他 
们 愿意 。 


DB-API 规 范 建议 但 不 强制 接口 程序 的 开发 者 为 所 有 数据 库 接口 模块 编写 异常 类 。 如 果 没 有 提 
供 异 常 类 ， 则 假定 该 连接 对 象 会 引发 一 致 的 模块 级 异常 。 一 旦 你 完成 了 数据 库 连 接 ， 并 且 关 
闭 了 游标 对 象 ， 你 应 该 执行 commit() 提 交 你 的 操作 ， 然 后 关闭 这 个 连接 。 


21.2.3 游标 对 象 


当 你 建立 连接 之 后 ， 就 可 以 与 数据 库 进行 交互 。 就 像 我 们 在 前 一 小 节 提 到 的 ， 一 个 游标 允许 
用 户 执行 数据 库 命 令 和 得 到 查询 结果 。 一 个 Python DB-API 游 标 对 象 总 是 扮演 游标 的 角色 ， 无 
论 数据 库 是 否 申 正 支持 游标 。 从 这 一 点 讲 ， 数 据 库 接口 程序 必须 实现 游标 对 象 。 只 有 这 样 ， 

才能 保证 无 论 使 用 何 种 后 端 数据 库 你 的 代码 都 不 需要 做 任何 改变 。 


创建 游标 对 象 之 后 ， 你 就 可 以 执行 查询 或 其 他 命令 (或 者 多 个 查询 和 多 个 命令 ) ， 也 可 以 从 
结果 集中 取出 一 条 或 多 条 记录 。 表 21.6 列 举 了 游标 对 象 拥有 的 属性 和 方法 。 


:] 
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X 21.6 游标 对 象 的 属性 
对 象 属性 描述 

yum i 使 用 fechmany() 方 法 一 次 取出 多 少 条 记录 , RUM 1 

connection 创建 此 游标 对 象 的 连接 (可 这 ) 
返回 游标 活动 状态 《一 个 伺 含 七 个 元 素 的 元 组 》: (name. type code; 

description display size. internal size. precision. scale. null ok); 只 有 name 和 
type. code 是 必须 提供 的 

lastrowid 返回 最 后 更 新 行 的 jd( 可 选 ),( 如 果 数 据 亩 不 支持 行 ide. 默认 返回 None) 

nowcout 最 后 一 次 execute0) 换 作 返 回 或 影响 的 行 数 











callproc(func[ args ]) 
closet) 





executetop( args]) 





调用 一 个 存储 过 程 





x antris 
ft fr— T NONE fede A 
X4 execute() 和 map0 的 结合 ， 为 给 定 的 每 一 个 参数 准备 并 执行 一 个 数 









ax 














executemany(op,args ) EN fe 
对 象 属 性 Ho 
fetchone() 得 到 结果 集 的 下 一 行 
fetchmany(| size-cursor.arraysize]) Emr FN 
fetchalk() HET 下 的 所 有 行 
ter 0) 创建 一 个 和 过 代 对 象 (可 选 ; 参阅 next) 





游标 执行 后 数 指 亩 返回 的 信息 列 表 (元 组 集合 ) (可 选 ) 





next) 





rownumber 


setinput- sizes( sizes) 








使 用 选 代 对 象 得 到 缚 果 焦 的 下 一 行 (可 选 ; 类 似 fetehone(, HA 
Mer. 0) 





移 到 下 一 个 结果 集 Ong Hm) 
当前 结果 集中 游 栋 的 索引 {以 行为 单位 ， 从 0 开始) (9033) 
设置 输入 最 大 值 (必须 有 , 但 具体 实现 是 可 选 的 ) 

















sctoutput- size(sizel,col]) 


设置 大 列 的 缓冲 区 大 号 (必须 有 ,但 具体 实现 是 可 选 的 ) 





游标 对 象 最 重要 的 属性 是 execute*() 和 fetch*() 方 法 。 所 有 对 数据 库 服务 器 的 请 求 都 由 它们 来 完 
成 。 对 fetchmany() 方 法 来 说 ， 设 置 一 个 合理 的 arraysize 属 性 会 很 有 用 。 当 然 ， 在 不 需要 时 关 
掉 游 标 对 象 也 是 个 好 主意 。 如 果 你 的 数据 库 支 持 存储 过 程 ， 你 就 可 以 使 用 callproc() 方 法 。 


21.2.4 ”类 型 对 象 和 构造 器 


通常 两 个 不 同系 统 的 接口 要 求 的 参数 类 型 是 不 一 致 的 ， 壁 如 Python 调用 C 函 数 时 Python 对 象 
和 C 类 型 之 间 就 需要 数据 格式 的 转换 ， 反 之 亦 然 。 类 似 地 ， 在 Python 对 象 和 原生 数据 库 对 象 之 
间 也 是 如 此 。 对 于 Python DB-API 的 开发 者 来 说 ， 你 传递 给 数据 库 的 参数 是 字符 串 形式 的 ， 但 
数据 库 会 根据 需要 将 它 转 换 为 多 种 不 同 的 形式 。 以 确保 每 次 查询 能 被 正确 执行 。 


举例 来 说 ， 一 个 Python 字 符 串 可 能 被 转换 为 一 个 VARCHAR 或 一 个 TEXT， 或 一 个 BLOB， 或 
一 个 原生 BINARY 对 象 ， 或 一 个 DATE 或 TIME 对 象 。 一 个 字符 串 到 底 会 被 转换 成 什么 类 型 ? 必 
须 小 心地 尽 可 能 以 数据 库 期 望 的 数据 类 型 来 提供 输入 ， 因 此 另 一 个 DB-API 的 需求 是 创建 一 个 
构造 器 以 生成 特殊 的 对 象 ， 以 便 能 够 方便 地 将 Python 对 象 转换 为 合适 的 数据 库 对 象 。 表 21.7 
描述 了 可 以 用 于 此 目的 的 类 。SQL 的 NULL 值 被 映射 为 Pyhton 的 NULL 对 象 ， 也 就 是 None 。 
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表 21.7 类 型 对 象 和 构造 器 
类 型 对 象 mox 
Date(yr mody) Had S 
 Time(hr min sec) 时 间 值 对 象 
Timestamp(yr mo,dy hr, min, sec) MH gu. 


DatcFromTicksiticks) 
TimeFromTicks(ricks) 
~ TimestampFromTicks(rícks) 
Binary(string) 

















MILA 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 到 日 其 
通过 自 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 天 时 间 值 对 象 
illit £1 1920-01-01 00:00:01 utc 以 来 的 ticks EP RERO IUE 
erii sic maur 
Mey p d, Hbi. VARCHAR 














NUMBER 








描述 二 进 制 长 列 的 对 象 比如 RAW. BLOB 
播 述 数学 列 的 对 象 




















DATETIME 


DB-API 版 本 变更 


接 述 日 期 对 间 列 的 对 象 
描述 “row ID" 列 的 对 象 








有 几 个 重要 的 变更 发 生 在 DB-API 从 1.0 (1996) 升级 到 2.0 (1999) 时 : 


e. 从 API 中 移 除了 原来 必须 


e 更 新 了 类 型 对 象 ; 


的 dbi 模 块 ; 


e 增加 了 新 的 属性 以 提供 更 多 用 的 数据 库 绑 定 ; 


e 变更 了 callproc() 的 语义 并 重 定 义 了 execute() 的 返回 值 ; 


e 基于 异常 的 错误 处 理 。 


自从 DB-API 2.0 发 布 以 来 ， 曾 经 在 2002 年 加 入 了 一 些 可 选 的 DB-API 扩 展 ， 但 一 直 没 有 什么 重 


大 的 变更 。 在 DB-SIG 邮 件 列表 中 一 直 在 讨论 DB-API 的 未 来 版 本 


它 将 包括 以 下 特性 : 


e. 当 有 一 个 新 的 结果 集 时 nextset() 会 有 一 个 更 合适 的 返回 值 ; 


e float 变 更 为 Decimal; 
e 支持 更 灵活 的 参数 风格 ; 
e 预备 语句 或 语句 缓存 ; 


e 优化 事务 模型 ; 


e 确定 DB-API 可 移 值 性 的 角色 ; 


e. 增加 单元 测试 。 





暂时 命名 为 DB-API 3.0» 


如 果 你 对 这 些 API 特 别 感 兴趣 ， 欢 迎 积极 参与 。 下 面 有 一 些 手边 的 资源 。 


e http://python.org/topics/database 。 


e http://www.linuxjournal.com/article/2605 ° 
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e http://wiki.python.org/moin/DbApi3 ° 


21.2.5 ”关系 数据 库 


现在 我 们 准备 开始 ， 一 个 问题 摆 在 面前 ， 在 Pyhton 里 我 可 以 使 用 哪 种 数据 库 接口 ? 换言之， 
Python 支持 哪些 平台 ?答案 是 几乎 所 有 的 平台 。 下 面 是 一 个 不 怎么 完整 的 数据 库 支 持 列表 。 


商业 关系 数据 库 管 理 系统 
e Informix; 
e Sybase ; 
e Oracle ; 
e MS SQL Server ; 
e DB/2; 
e SAP ; 
e Interbase ; 
e Ingres ° 
开源 关系 数据 库 管 理 系统 
e MySQL ; 
e PostgreSQL : 
e SQLite ; 
e Gadfly ° 
数据 库 API 
e JDBC : 
e ODBC ° 
想 要 了 解 Python 都 支持 哪些 数据 库 ， 请 参阅 下 面 网 址 : 


http://python.org/topics/database/modules.html 


21.2.6 ”数据 库 和 Python : 接口 程序 


对 每 一 种 支持 的 数据 库 ， 都 有 一 个 或 多 个 Python 接口 程序 允许 你 连接 到 目标 数据 库 系统 。 某 
些 数据 库 ， 比 如 Sybase、SAP、Oracle 和 SQLServer， 都 有 两 个 或 更 多 个 接口 程序 可 供 选 
择 。 你 要 做 的 就 是 挑选 一 个 最 能 满足 你 需求 的 接口 程序 。 你 挑选 接口 程序 的 标准 可 以 是 ， 性 


能 如 何 、 文 档 或 WEB 站 点 的 质量 如 何 、 是 否 有 一 个 活跃 的 用 户 或 开发 社区 、 接 口 程序 的 质量 
和 稳定 性 如 何等 。 记 住 绝 大 多 数 接口 程序 只 提供 基本 的 连接 功能 ， 你 可 能 需要 一 些 额 外 的 特 
性 。 高 级 应 用 代码 ， 如 线程 和 线程 管理 及 数据 库 连 接 池 的 管理 等 ， Sp UON 


如 果 你 不 想 处 理 这 些 ， 比 方 说 你 不 喜欢 自己 写 SQL， 也 不 想 参与 数据 库 管 理 的 细节 一 那么 
本 章 后 面 讲 到 的 ORM (Object-Relational Mappers， 对 象 -关系 管理 器 ) 应 该 可 以 满足 你 的 要 
求 。 现 在 来 看 一 些 使 用 接口 程序 访问 数据 库 的 例子 ， 关 键 之 处 在 于 设置 数据 库 连接 。 在 建立 
连接 之 后 ， 不 管 后 端 是 何 种 数据 库 ， 对 DB-API 对 象 的 属性 和 方法 进行 操作 都 是 一 样 的 。 


21.2.7 使 用 数据 库 接口 程序 举例 


首先 ， 我 们 来 看 一 下 例子 代码 : 创建 数据 库 、 创 建 表 、 使 用 表 。 我 们 分 别提 供 了 使 用 
MySQL、PostgreSQL 和 SQLite 的 例子 


1. MySQL 


这 里 我 们 以 MySQL 数 据 库 为 例 ， 使 用 唯一 的 MySQL 接 口 程序 MySQLdb， 这 个 接口 程序 又 名 
MySQL-python。 在 这 部 分 代码 里 ， 我 们 故意 在 例子 里 埋 下 一 个 错误 。 


首先 我 们 以 管理 员 身 份 创建 一 个 数据 库 ， 并 赋予 相应 权限 ， 之 后 我 们 再 以 普通 用 户 身 
份 登录 数据 库 ， 以 便 你 能 了 解 你 希望 得 到 什么 ， 这 样 你 会 想到 为 它 创建 一 个 事件 处 理 程序 。 


>>> import MySQLdb 
cxn = MySQLdb.connect (user-'root') 


>>> cxn.query('DROP DATABASE test"') 


Traceback (most recent call last): 
i ne 1 n 
mysql exceptions.OperationalError: (1008, "Can't drop database 'test';database 
1 exist") 
>>> cxn.query('CREATE DATABASE test") 
>>> cxn.query("GRANT ALL ON test.* to ''8'localhost'") 
> cxn.commit() 
^ cxn.close() 


在 上 面 的 代码 中 ， 我 们 没有 使 用 cursor 对 得。 某 些 〈 但 不 是 所 有 的 ) 接口 程序 拥有 连接 对 象 ， 
这 些 连接 对 象 拥 有 query() 方 法 ， 可 以 执行 SQL 查询 。 我 们 建议 你 不 要 使 用 这 个 方法 ， 或 者 事 
先 检 查 该 方法 在 当前 接口 程序 当中 是 和 否 可 用 。 之 后 我 们 以 普 PUERUM ET ae 
据 ， 创 建 表 ， 然 后 通过 Python 执行 SQL 查询 和 命令 ， 来 完成 我 们 的 工作 。 这 次 我 们 使 用 游标 
对 象 (cursors) 和 它们 的 execute() 方 法 ， 下 一 个 交互 集 演 示 了 创建 表 。 
下 面 的 代码 演示 了 如 何 创建 一 个 表 。 在 删除 一 个 表 之 前 如 果 试 图 重建 这 个 表 将 产生 错误 。 

>>> cxn = MySQLdb.connect (db='test') 

>>> cur = cxn.cursor() 

>>> cur.execute('CREATE TABLE users (login VARCHAR (8), uid INT)') 

OL 


现在 我 们 来 插入 几 行 数据 到 数据 库 ， 然 后 再 将 它们 取出 来 。 
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>>> cur.execute("INSERT INTO users VALUES('john', 7000)") 

lL 

>>> cur.execute("INSERT INTO users VALUES('jane', 7001)") 

1L 

>>> cur.execute("INSERT INTO users VALUES('bob', 7200)") 

lL 

>>> cur.execute("SELECT * FROM users WHERE login LIKE 'j$'") 
2L 

>>> for data in cur.fetchall(): 


print '$sWMt$s' $ data 


john 7000 
jane 7001 


最 后 一 个 特性 是 更 新 表 ， 包 括 更 新 或 删除 数据 。 


>>> cur.execute("UPDATE users SET uid-7100 WHERE uid-7001") 
IL 

>>> cur.execute ("SELECT * FROM users") 

3L 

>>> for data in cur.fetchall(): 


print '%s\t%s' % data 


john 7000 
jane 7100 
bob 7200 


>>> cur.execute('DELETE FROM users WHERE login="bob"') 
lL 

>>> cur.execute('DROP TABLE users') 

OL 

>>> cur.close() 

>>> cxn.commit () 


»»» cxn.close() 


MySQL 是 最 流行 的 开源 数据 库 之 一 。 毫 无 疑问 会 有 一 个 针对 MySQL 的 Python 接口 程序 。 不 过 
Python 标准 库 中 并 没有 集成 这 个 接口 程序 ， 这 是 一 个 第 三 方 包 ， 你 需要 单独 下 载 并 安装 它 。 
在 本 章 末尾 的 索引 页 ， 你 可 以 找到 如 何 下 载 它 。 


2. PostgreSQL 


另 一 个 著名 的 开源 数据 库 是 PostgreSQL。 与 MySQL 不 同 ， 有 至 少 3 个 Python 接口 程序 可 以 访 
问 PosgreSQL: psycopg, PyPgSQL 和 PyGreSQL， 第 四 个 ，PoPy， 现 在 已 经 被 废弃 (2003 
年 ， 它 贡献 出 自己 的 代码 ， 与 PygreSQL 整 合 在 一 起 ) 。 这 三 个 接口 程序 各 有 长 处 ， 各 有 缺 
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点 ， 根 据 实践 结果 来 选择 使 用 哪个 接口 更 为 明智 。 
多 亏 他 们 都 支持 DB-APl， 所 以 他 们 的 接口 基本 一 致 ， 你 只 需要 写 一 个 应 用 程序 ， 然 后 分 别 测 
试 这 三 个 接口 的 性 能 (如果 性 能 对 你 的 程序 很 重要 的 话 ) 。 下 面 我 给 出 这 三 个 接口 的 连接 代 
码 : 
psycopg 
>>> import psycopg 


>>> cxn = psycopg.connect (user-'pgsql') 


PyPgSQL 
>>> from pyPgSQL import PgSQL 


>>> cxn = PgSQL.connect (user-'pgsql') 


PyGreSQL 


>>> import pgdb 


>>> cxn = pgdb.connect (user-'pgsql') 
好 ， 下 面 的 代码 就 能 够 在 所 有 接口 程序 下 工作 了 。 


>>> cur = cxn.cursor() 
>>> cur.execute('SELECT * FROM pg_database') 
'»»» rows = cur.fetchall() 
>>> for i in rows: 
print i 
>>> cur.close() 
>>> cxn.commit () 


>>> cxn.close() 


最 后 ， 你 会 发 现 他 们 的 输出 有 一 点 点 轻微 的 不 同 。 


5% E2 米 2 mi 
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PyPgSQL 

sales 

templatel 

templateO 

Psycopg 

('sales', 1, O0, Or 1, 17140, '140626', '3221366099', 


'", None, None) 


('templatel', 1, O, 1, 1, 17140, '462', '462', '', None, 
' {pgsql=C*T*/pgsql}') 

('templateO', 1, O, 1, O, 17140, '462', '462', '', None, 
' (pgsq1-C*T* /pgsq1) ') 

PyGreSQL 

['sales', 1, 0, False, True, 17140L, '140626', 
'3221366099', '', None, None] 


['templatel', 1, 0, True, True, 17140L, '462', '462', 
'", None, 'í(pgsql-C*T*/pgsq1)'] 

['templateO', 1, 0, True, False, 17140L, '462', 
'462', '', None, 'í(pgsql-C*T*/pgsq1) '] 


3. SQLite 


对 非常 简单 的 应 用 来 说 ， 使 用 文件 进行 持久 存储 通常 就 足够 了 。 但 对 于 绝 大 多 数 数据 驱动 的 
应 用 程序 必须 使 用 全 功能 的 关系 数据 库 。SQLite 介 于 二 者 之 间 ， 它 定位 于 中 小 规模 的 应 用 。 
它 是 相当 轻 量 级 的 全 功能 关系 型 数据 库 ， 速 度 很 快 ， 几 乎 不 用 配置 ， 并 且 不 需要 服务 器 。 


SQLite 正 在 迅速 流行 起 来 。 并 且 在 各 个 平台 上 都 能 用 。 Python: 5 中 就 集成 了 前 面 介绍 的 
pysqlite 数 据 库 接口 程序 ， 作 为 Python2.5 的 sqlite3 模 块 。 这 是 Python 第 一 次 将 一 个 数据 库 接 口 
程序 纳入 标准 库 ， 也 许 这 标志 着 一 个 新 的 开始 。 


它 被 打包 到 Python 当中 并 不 是 因为 他 比 其 他 的 数据 库 接口 程序 更 优秀 ， 而 是 因为 他 足够 简 

单 ， 使 用 文件 (或 内 存 ) 作为 它 的 后 端 存储 ， 就 像 DBM 模 块 做 的 那样 ， 不 需要 服务 器 ， 而 且 
也 不 存在 授权 问题 。 它 是 Python 中 其 他 的 持久 存储 解决 方案 的 一 个 替代 品 ， 一 个 拥有 SQL 访 
问 界 面 的 优秀 替代 品 。 在 标准 库 中 有 这 么 一 个 模块 ， 就 能 方便 用 户 使 用 Python 和 SQLite 进 行 
软件 开发 ， 等 到 软件 产品 正式 上 市 发 布 时 ， 只 要 有 需要 ， 就 能 够 很 容易 的 将 产品 使 用 的 数据 
库 后 端 变 更 为 一 个 全 功能 的 、 更 强大 的 类 似 MySQL、PostgreSQL、Oracle 或 SQL Server 那 样 
的 数据 库 。 当 然 ， 对 那些 不 需要 那么 大 马力 的 应 用 程序 来 说 ，SQLite 已 经 足够 使 用 。 


尽管 标准 库 已 经 提供 了 数据 库 接 口 程 序 ， 你 仍然 需要 自己 下 载 真 正 的 数据 库 软 件 。 安装 
好 之 后 ， 你 就 只 需要 打开 Python 解释 器 ， 下 面 是 一 个 例子 : 


>>> import sqlite3 

>>> cxn = sqlite3.connect('sqlite test/test') 

>>> cur = cxn.cursor() 

>>> cur.execute('CREATE TABLE users(login VARCHAR(8), uid 
INTEGER) ') 

>>> cur.execute('INSERT INTO users VALUES("john", 100)"') 

>>> cur.execute('INSERT INTO users VALUES("jane", 110)"') 

>>> cur.execute('SELECT * FROM users") 

>>> for eachUser in cur.fetchall(): 


print eachUser 


(u'john', 100) 

(u'jane', 110) 

>>> cur.execute('DROP TABLE users') 
«sqlite3.Cursor object at 0x3d4320» 
>>> cur.close() 

>>> cxn.commit () 


>>> cxn.close() 


OK ， 这 个 小 例子 已 经 足够 了 。 接 下 来 ， 我 们 来 看 一 个 小 程序 ， 它 类 似 前 面 使 用 MySQL 的 例 
子 ， 但 完成 几 种 新 的 功能 : 


e 创建 一 个 数据 库 (如 果 必 要 ) 
e 创建 一 个 表 

e 在 表 中 插入 行 

e 在 表 中 更 新 行 

e 在 表 中 删除 行 

e MR 


这 个 例子 中 ， 我 们 仍然 使 用 两 个 其 他 的 开源 数据 库 。SQLite 现 如 今 已 经 相当 流行 。 它 体积 
小 ， 而 且 足 够 快 ， 是 一 个 拥有 几乎 全 部 功能 的 相当 轻 量 级 的 数据 库 。 这 个 例子 中 用 到 的 另 一 
个 数据 库 是 Gadfly， 一 个 基本 兼容 SQL 的 纯 Python 写 成 的 关系 数据 库 。 ( 某 些 关键 的 数据 库 
结构 有 一 个 C 模 块 ， 不 过 Gadfly 没 有 它 也 一 样 可 以 运行 (当然 ， 会 慢 不 少 ， 嘿 嘿 ) ) 。 


在 进入 代码 之 前 ， 有 几 件 事 要 提醒 。SQLite 和 Gadfly 需 要 用 户 指 定 保存 数据 库 文件 的 位 置 
(MySQL 有 一 个 默认 区 域 保存 数据 ， 在 使 用 MySQL 数 据 库 时 无 需 指 定 这 个 ) 。 另 外 ，Gadfly 
目前 的 版 本 还 不 兼容 DB-API 2.0， 也 就 是 说 ， 它 缺失 一 些 功能 ， 尤 其 是 缺少 我 们 例子 中 用 到 
的 cursor 属 性 rowcount ° 


4. 数 据 库 接口 程序 应 用 程序 举例 


在 下 面 这 个 例子 里 ， 我 们 演示 了 Python 如 何 访问 数据 库 。 事 实 上 ， 我 们 的 程序 支持 三 种 不 同 
的 数据 库 系 统 : Gadfly、SQLite 和 MySQL。 我 们 将 要 创建 一 个 数据 库 (如 果 它 不 存在 的 
话 ) ， 然 后 进行 多 种 数据 库 操作 ， 比 如 创建 表 、 删 除 表 、 插 入 数据 、 更 新 数据 、 删 除数 据 
等 。 在 下 一 小 节 中 的 ORM 中 我 们 将 重复 例子 21.1 的 这 些 功 能 。 


5. 逐 行 解释 

第 1~ 18 行 

脚本 的 第 一 部 分 导入 必须 的 模块 ， 创 建 一 些 "全 局 常量 ”( 列 的 显示 大 小 及 我 们 的 程序 支持 的 数 
HÈ) 。 其 中 setup() 函 数 提供 一 个 简单 界面 让 用 户 ; PEN ? 


4 E XUIADB EXC E > ERAR EA R o dix Ze h A P d Zee dE e A hg GAS E 
决定 。 也 就 是 说 ， 如 果 用 户 选择 MySQL, DB. EXC4 X mysql. exceptions > (&J6 2E 4E » Ade 
我 们 用 流行 的 面向 对 象 的 方式 来 开发 这 个 应 用 ， 它 将 会 以 一 个 实例 属性 的 方式 表示 ， 比 如 
self.db_exc_module 或 者 什么 别 的 名 字 。 


第 20 ~ 75 行 
这 | 数据 库存 取 一 致 性 。 在 每 一 小 节 的 开头 ， 我 们 尝试 载 入 需要 的 数 
据 库 模块 。 如 果 找 不 到 合适 的 模块 ，None 值 被 返回 ， 表 示 这 个 数据 库 系 统 暂 不 支持 。 


i 车 接 建 立 以 后 ， 其 余 的 代码 对 数据 库 和 接口 程序 来 说 都 是 透明 的 (不 区 分 哪 种 数据 
、 哪 种 接口 程序 ， 代 码 都 可 以 工作 ) 。 有 一 个 唯一 的 例外 ， 就 是 脚本 的 insert() 部 数 。 在 这 
p. 的 所 有 3 人 小段 中 ， 数 据 库 连接 成 功 后 会 返回 一 个 连接 对 象 CXxn。 


如 果 选 中 了 SQLite (24 行 ~36 行 ) ， 我 们 尝试 载 入 一 个 数据 库 接 口 程序 。 我 们 首先 尝试 载 入 标 
准 库 模块 sqlite3 (Python2.5 及 更 高 版 本 支持 ) ， 如 果 载 入 失败 ， 就 会 去 寻找 第 三 方 pysqlite2 
包 。 这 个 包 支 持 Python2.4.x 或 更 老 些 的 系统 。 


如 果 成 功 导 入 合适 的 接口 程序 ， 由 于 SQLite 是 基于 文件 的 数据 库 系统 ， 同 我 们 需要 确认 一 下 
数据 库 文件 所 在 的 目录 是 否 存 在 (当然 ， 你 也 可 以 选择 在 内 存 里 创建 一 个 数据 库 ) 。 当 调用 
connect() 函 数 时 ， 如 果 这 个 数据 库 文 件 已 经 存在 ，SQLite 会 使 用 这 个 数据 库 ， 如 果 文 件 不 
存 ， 它 就 会 创建 一 个 新 文件 。 


例 21.1 数据 库 接口 程序 示例 


这 段 脚 本 使 用 同样 的 接口 对 多 种 数据 库 执行 了 一 些 数 据 库 基本 操作 。 
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1 #!/usr/bin/env python 

2 

3 import os 

4 from random import randrange as rrange 
5 

6 COLSIZ = 10 

7  RDBMSs = ('s': 'sqlite', "ms 'mysql', 'g': 'gadfly'] 
8 DB EXC = None 

9 

10 def setup(): 

11 return RDBMSs[raw input(''' 

12 Choose a database system: 

13 | 

14 (M)ySQL 


15 (G)adfly 
16 (S)OQLite 


17 

18 Enter choice: ''').strip().lower()[0]] 
19 

20 def connect(db, dbName): 

21 global DB EXC 

22 dbDir = '$s $s' è (db, dbName) 

23 
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24 if db =» 'sqlite': 

25 try: 

26 import sjlire3 

27 except ImportError, e: 

28 try: 

29 from pysqlite2 import doapi2 as sqlite 
30 except InportError, e: 

31 return None 

32 

33 DB EXC = sqlite3 

34 if not os.path.isdir(dbDir): 

35 os.mxdir (dbDir) 

36 cxn = sqlite.connect(os.path.join(dbDir, dbName)) 
37 

38 elif do == 'mysql': 

39 try: 

40 import MySQLdb 

41 import mysql exceptions as DB EXC 

42 except ImportError, e: 

43 return None 

44 

45 try: 

46 cxn = MySQLdb. connect (db*dbName) 

47 except mysql exceptions.OperationalError, e: 
48 cxn = MySQLdb.connect (user-'root') 

49 try: 

50 exn.query('DROP DATABASE *s' è dbName) 
51 except DB EXC.OperaticnalError, e: 

52 pass 

53 cxn.query('CREATE DATABASE *s' $* dbName) 

$4 cxn.query("GRANT ALL ON *$5.* to ''é'localhost'" 4 dbName) 
55 ecxn.commit () 

56 exn.close() 

57 cxn = MySQLdb.connect (dbedbName) 

58 

59  elif db == 'gadfly': 

60 try: 

él from gadfly import gadfly 

62 DB EXC = gadfly 

63 except Import£rror, e: 

64 return None 

65 

66 try: 

67 cxn = gadfly(dbName, dbDir) 

68 except IOError, e: 

69 cxn * gadfly() 

70 if not os.path.isdir(dbDir): 

"1 os.mkdir(dbDir) 

72 cxn.startup(dbName, dbDir) 
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73 else: 

74 return None 

75 return cxn 

76 

77 def create(cur]: 

78 try 

79 Ccur.execute(''' 

80 CREATE TABLE users ( 

81 2ogin VARCHARIB), 

82 uid INTEGER, 

83 prid INTEGER) 

84 T 

85 except DB EXC.OperationalError, e: 

86 drop(cur) 

87 create(cur) 

88 

89 drop = lambda cur: cur.execute('DROP TABLE vsers'] 

90 

91 NAMES = ( 

92 (*aaron', 8312), ('angela', 7603), ('dave', 7306), 
93 (*davina', 7902), ('elliot', 7911), ('ernie', 7410], 
94 (*j3ess', 7912), ('jim', 7512), ('larry',. 7311), 
95 ('leslie', 7808), ('melissa', 8602), ('pat', 7711), 
96 ('serena', 7003), ('stan', 7607), ('faye', 6812), 
97 (*amy', 7209), 

98 ) 

95 


100 def randName(): 
101 pick = list(NAMES) 
102 while lenlpick) > 0: 


103 yield pick.pop(rrange(len(pick))) 

104 

105 def insert(cur, db): 

106 if db == 'sqlite': 

107 cur.executemany("INSERT INTO users VALUES(?, ?, ?)", 
108 [(who, uid, rrange(1,5)) for who, uid in randName()]) 
109 elif do == 'gadfly': 

110 for who, uid in randName(): 

111 cur.execute("INSER7 INTO users VALUES(?, ?, ?)", 
112 (who, uid, rrange(1,5))) 

113 elif db == 'mysql': 

114 Cur.executemany("INSERT INTO users VALUES (ts, $3, ts)", 
115 [(who, uid, rrange(1,5)) for who, uid in randName()]) 
116 


117 getRC = lambda cur: cur.rowcount if hasattr(cur, 
'rowcount') else -l 


118 
119 def update(cur): 
120 fr = rrange(1,5] 
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to = rrange(1,5) 
cur.execute [( 

"UPDATE users SET prided WHERE pride&d" $ (to, fr)) 
return fr, to, getRC(cur) 


def delete(cur): 


rm = rrange(1,5) 
Ccur.execute('DELETE FROM users WHERE pride*d' & rm) 
return rm, getRC(cur) 


def dbDusp (cur): 


cur.execute('SELECT * FROM users') 

print 'inis*sis' * ('LOGIN'.1just(COLSI2), 
'USERID'.1just(COLSIZ), 'PROJM'.1just(COLSIZ)) 

for data in cur.fetchall(): 


print '*s$sis' $ tuple([str(s).title().1just(COLSIZ) ^ 


for s in data]) 


def maintl: 


db = setup() 

print '*** Connecting to Sr database' è db 

cxn = connect(db, 'test') 

if not cxn: 
print 'ERROR: r not supported, exiting' * db 
return 


cur = cxn.cursor() 


print '*n*** Creating users table' 
create (cur) 


print 'in*** Inserting names into table' 
insert(cur, db) 
dbDump (cur) 


print 'in*** Randomly moving folks', 

fr, to, num * update(cur) 

print 'from one group {%d) to another (*d)' % (fr, to) 
print 'At(*d users moved)' % num 

dbDusp (cur) 


print 'An*** Randomly choosing group', 
rm, num = delete(cur) 

print '(*d) ro delete' $ ra 

print 'it(id users removed)' è num 
dbDump (cur) 


print 'in*** Dropping users table' 
drop (cur) 
eur.close() 


170 cxn.commit () 


LXI cxn.close() 
172 


173 if _name_ == 


174 main() 
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MySQL (38-5741) 的 数据 文件 会 存 保 在 默认 的 数据 存储 区 域 ， 所 以 不 需要 用 户 指 定 存 储 位 
置 。 我 们 的 代码 尝试 连接 指定 的 数据 库 。 如 果 发 生 错误 ， 有 可 能 是 数据 库 不 存在 ， 或 者 虽然 
数据 库存 在 但 我 们 没有 权限 访问 它 。 由 于 这 仅仅 是 一 个 测试 应 用 程序 ， 我 们 选择 完全 先 删 掉 
这 个 数据 库 (忽略 掉 如 果 数 据 库 不 存在 可 能 引发 的 错误 ) ， 然 后 重建 该 库 ， 然 后 给 访问 它 的 
A P RAPIT ° 


我 们 的 应 用 程序 支持 的 最 后 一 个 数据 库 是 Gadfly (4859-7541) 。 在 本 书写 作 的 时 候 ， 这 个 数 
据 库 已 经 几乎 但 还 没有 完全 兼容 DB-API， 你 也 会 在 这 个 程序 里 看 到 这 一 点 。) 它 使 用 类 似 

SQLite 的 启动 机 制 : 它 的 启动 目录 是 数据 文件 所 在 的 目录 。 如 果 数 据 文件 在 那儿 ， 那 没有 问 
题 ， 如 果 那 儿 没 有 数据 文件 ， 你 必须 重新 启动 一 个 新 的 数据 库 (为 什么 非 要 这 样 ， 我 们 也 不 
十 分 清楚 。 我 们 认为 startup() 函 数 应 该 被 合并 到 构造 器 函数 gadfly.gadfly() 当 中 去 ) ° 


77 ~ 89 行 


create() 函 数 在 数据 库 中 创建 一 个 新 的 users 表 ， 如 果 中 间 产 生 问题 ， 几 乎 肯定 是 因为 这 个 表 已 
经 存在 。 如 果 正 是 这 个 原因 的 话 ， 删 掉 这 个 表 ， 然 后 递归 调用 create() 函 数 来 重新 创建 它 。 这 
个 代码 有 一 个 缺陷 ， 就 是 当 重 建 表 仍然 失败 的 话 ， 你 将 陷入 死 循 环 ， 直 至 内 存 耗 尽 。 在 本 章 
最 后 有 一 道 习题 就 是 这 个 问题 ， 你 可 以 试 着 修复 这 个 潜在 的 bug 。 


91 ~ 103 行 


这 可 能 是 除了 数据 库 操作 之 外 最 有 趣 的 代码 部 分 了 。 它 由 一 组 固定 用 户 名 及 |D 值 的 集合 及 一 
个 生成 器 函数 randName() 构 成 。 这 个 函数 的 代码 也 可 以 在 11.10 节 找到 。NAMES 常 量 是 一 个 
元 组 ， 因 为 我 们 在 randName() 这 个 生成 器 里 需要 改变 它 的 值 ， 所 以 我 们 必须 在 randName() 里 
先 将 它 转换 为 一 个 列表 。 我 们 一 次 随机 移 除 一 个 名 字 ， 直 到 列表 为 空 为 止 。 如 果 NAMES 本 身 
是 一 个 列表 ， 我 们 只 能 使 用 它 一 次 〈 它 就 被 消耗 光 了 ) 。 我 们 将 它 设 计 成 为 一 个 元 组 ， 这 样 
我 们 就 可 以 多 次 从 这 个 元 组 生成 一 个 列表 供 生 成 器 使 用 。 


105 ~ 115 行 


由 于 各 种 数据 库 之 间 有 一 些 细微 差别 ，insert() 骂 数 里 的 代码 是 依赖 具体 数据 库 的 。 举 例 来 
说 ，SQLite 和 MySQL 的 接口 程序 都 是 DB-API 兼 容 的 ， 所 以 它们 的 游标 对 象 都 拥有 
executemany() 方 法 ， 可 是 Gadfly 没 有 这 个 方法 ， 因 此 它 只 能 一 次 插入 一 行 。 


另 一 个 不 同 之 处 在 于 SQLite 和 Gadfly 的 参数 风格 是 qmark， 而 MySQL 的 参数 风格 是 format。 由 
于 这 些 原因 ， 格 式 字 符 串 必须 不 同 。 如 果 你 比较 细心 的 话 ， 你 会 看 到 他 们 的 参数 创建 过 程 非 
常 相 似 。 


这 段 代 码 的 功能 是 : 对 每 个 name-userID 数 据 对 ， 随 机 分 配 一 个 项 目 小 组 ID， 然 后 存 入 数据 
库 。 


117 行 


这 独立 的 一 行 是 有 一 个 条 件 表达 式 ( 读 作 Python 3 目 操作 符 ) ， 它 返回 最 后 一 步 操 作 所 影响 

的 行 数 ， 如 果 游 标 对 象 不 支持 这 个 属性 (也 就 是 说 这 个 接口 程序 不 兼容 DB-API) 的 话 ， 它 返 
回 -1。python2.5 中 新 增 了 条 件 表 达 式 ， 如 果 你 使 用 的 是 python 2.4.x 或 更 老 版 本 ， 你 可 能 就 需 
要 将 它 转换 为 老 风格 的 方式 了 ， 如 下 所 示 。 


getRC = lambda cur: (hasattr(cur, 'rowcount') \ 


and [cur.rowcount] or [-1])[0] 


如 果 你 看 不 太 明 白 这 行 代码 ， 不 用 着 急 。 看 看 FAQ 就 能 知道 为 什么 最 终 Python2.5 中 加 入 了 条 
件 表达 式 。 如 果 你 能 弄 明白 ， 你 就 彻底 搞 明 白 了 Python 对 象 以 及 他 们 的 布尔 值 。 


119 ~ 129 行 

update() 和 delete() 亟 数 随 机 从 一 个 组 里 选择 了 几 条 记录 ， 如 果 是 Update 操作 ， 就 将 他 们 从 当 
前 小 组 移 到 另 一 个 小 组 (也 是 随机 选择 的 ) 。 如 果 是 delete 操 作 ， 则 删除 它们 。 

131 ~ 137 行 

dbDump() 函 数 从 数据 库 中 读 取 所 有 数据 ， 并 将 数据 进行 格式 化 ， 然 后 显示 给 用 户 看 。print 语 
名 显示 每 个 用 户 不 够 清晰 ， 所 以 我 们 将 它 分 开 显 示 。 

首先 ， 通 过 fetchall() 方 法 读 取 数 据 ， 然 后 迭代 遍历 每 个 用 户 ， 将 三 列 数据 (login ` uid ` 
prid) 转换 为 字符 串 〈 如 果 它 们 还 不 是 的 话 ) ， 并 将 姓 和 名 的 首 字母 大 写 ， 再 格式 化 整个 字符 
为 左 对 齐 的 COLSIZ 列 (右边 留 白 ) 。 由 代码 生成 的 字符 串 是 一 个 列表 (通过 列表 解析 ) ， 我 
们 需要 将 它们 转换 成 一 个 元 组 以 支持 % 操 作 符 。 

139 ~ 174 行 

本 部 影片 的 导演 main() 出 场 。 它 将 上 面 定义 的 这 些 函 数组 织 起 来 ， 让 它们 尽情 发 挥 。 (假定 它 
们 没有 因为 找 不 到 数据 库 接口 程序 或 者 不 能 得 到 有 效 连接 对 象 而 中 途 退 出 (第 143~145 

行 ) ) 。 它 的 大 部 分 代码 都 是 能 够 自我 解释 的 print 语 句 。 最 后 main() 关 闭 游标 对 象 ， 提 交 操 
作 ， 然 后 关闭 数据 库 连 接 。 脚 本 的 最 后 几 行 代码 用 来 启动 脚本 的 执行 。 


21.3 对象- 关系 管理 器 (ORM) 


通过 前 一 节 我 们 知道 ， 如 今 有 很 多 种 数据 库 系 统 ， 他 们 中 的 绝 大 多 数 都 有 Python 接口 ， 以 方 
便 你 驾驭 他 们 的 能 量 。 这 些 系统 唯一 的 缺点 是 需要 你 懂得 SQL。 如 果 你 喜欢 折腾 Python 对 象 
却 讨 拓 SQL 查询 ， 又 想 使 用 关系 型 数据 库 作 为 你 的 数据 存储 的 后 端 ， 你 就 完全 具备 成 为 一 个 
ORM 用 户 的 天 资 。 


21.3.1 考虑 对 象 ， 而 不 是 SQL 


这 些 系统 的 创建 者 将 绝 大 多 数 纯 SQL 层 功能 抽象 为 Python 对 象 ， 这 样 你 就 无 需 编写 SQL 也 能 
够 完成 同样 的 任务 。 如 果 你 在 某 些 情况 下 实在 需要 SQL， 有 些 系统 也 允许 你 拥有 这 种 灵活 
性 。 但 绝 大 多 数 情况 下 ， 你 应 该 尽量 避免 进行 直接 的 SQL 查询 。 


数据 库 的 表 被 转换 为 Python 类 ， 它 具有 列 属性 和 操作 数据 库 的 方法 。 让 你 的 应 用 程序 支持 
ORM 非 常 类 似 使 用 那些 标准 的 数据 库 接 口 程序 。 由 于 大 部 分 工作 由 ORM 代 为 处 理 ， 相 比 直接 
使 用 接口 程序 来 说 ， 一些 事情 可 能 实际 需要 更 多 的 代码 。 令 人 欣慰 的 是 ， 一 点 点 额外 的 付出 
会 回报 你 更 高 的 生产 率 。 


21.3.2 Python 和 ORM 


如 今 最 知名 的 bad ORMJ&3& X SQLAlchemy?e SQLObject » à T — 4 A A e i 
学 ， 我 们 会 分 别 给 出 SQLAIchemy 和 SQLObject 的 例子 。 只 要 你 能 摘 清楚 这 两 种 ORM 的 使 
用 ， 转 到 | 其 他 的 ORM 将 是 相 当 简单 的 事 。 


其 他 的 Python ORM 包 括 pyDO/PyD02、PDO、Dejavu、Durus、QLime 和 ForgetSQL 。 一 些 
大 型 的 Web 开 发 工具 /框架 也 可 以 有 自己 的 ORM 组 件 ， 如 WebWare MiddleKit 和 Django 的 数据 
库 API。 需 要 指出 的 是 ， 知 名 的 ORM 并 不 意味 着 就 是 最 适 的 应 用 程序 的 ORM。 那 些 其 他 
的 ORM 虽 然 没 有 纳入 我 们 的 讨论 范围 ， 但 一 样 有 可 能 是 适合 你 的 应 用 程序 的 选择 。 


21.3.3 ”雇员 数据 库 举 例 


现在 我 们 将 shuffle 应 用 程序 ushuffle db.py 改 造 为 使 用 SQLAIchemy 和 SQLObject 实 现 。 数 据 
库 后 端 仍然 是 MySQL。 相 对 于 直接 使 用 原始 SQL 来 讲 ， 我 们 使 用 DRM 时 用 类 代替 了 函数 ， 
样 会 更 有 对 象 的 感 党 。 两 个 例子 都 使 用 了 ushuffle db.py 中 的 NAMES 集 合 和 随机 名 字 选 择 函 
数 。 这 是 为 了 避免 将 同样 的 代码 到 处 复制 粘贴 ， 代 码 能 够 被 有 效 重 用 是 件 好 事情 。 


1.SQLAlchemy 


与 SQLObject 相 比 ，SQLAIchemy 的 接口 在 某 种 程度 上 更 接近 SQL ， 所 以 我 们 先 从 

SQLAIchemy 开 始 。SQLAIchemy 的 抽象 层 确 实 相 当 完 美 ， 而 且 在 你 必须 使 用 SQL 完成 某 些 功 
能 时 ， 它 提供 了 足够 的 灵活 性 。 你 会 发 现 这 两 个 DRM 模 块 在 设置 及 存 取 数据 时 使 用 的 术语 非 
常 相 似 ， 代 码 长 度 也 很 接近 ， 都 比 ushuffle db.py^ (包括 共享 的 names 列 表 和 随机 名 字 生 成 


和 前 面 一 样 ， 第 一 件 事 是 导入 相关 的 模块 和 常量 。 E ak ei 准 库 模块 ， 然 
后 再 导入 第 三 方 或 扩展 模块 ， 最 后 导入 本 地 模块 这 种 风格 。 常量 都 是 自 解释 的 。 


12 ~ 31 行 
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12~31 行 是 类 的 构造 器 ， 类 似 ushuffle db.connect()。 它 确保 数据 库 可 用 并 返回 一 个 有 效 连 接 
(第 18~31 行 ) 。 这 也 是 唯一 能 看 到 原始 SQL 的 地 方 。 这 是 一 种 典型 的 操作 任务 ， 不 是 面向 应 


用 的 任务 。 


33 ~ 44 行 


ik^Mry-except- 4] (33~40 行 ) 用 来 重新 载 入 一 个 已 有 的 表 ， 或 者 在 表 不 存在 的 情况 下 创建 


一 个 新 表 。 最 终 我 们 得 到 一 个 合适 的 对 象 实例 。 
例 21.2 
这 个 user shuffle 程 序 的 主角 是 SQLAIchemy 前 端 和 和 MySQL 数据 库 后 端 。 


t!/usr/bin/env python 


1 
2 
3 import os 

4 from random import randrange as rrange 
5 

6 

7 

8 


from sqlalchemy import * 
from ushuffle db import NAMES, randName 


FIELDS = ('login', 'uid', 'prid') 
9 DBNAME-'test' 
10 COLSIZ-210 


11 

12 class MySQLAlchemy (object): 

13 def — init | (self, db, dbName): 

14 i import MySQLdb 

15 import _mysql_exceptions 

16 MySQLdb = pool.manage (MySQLdb) 

17 url = 'mysql://db-*s' % DBNAME 

18 eng 7 create engine (url) 

19 try: 

20 cxn = eng.connection() 

21 except mysql exceptions.OperationalError, e: 

22 engl = create engine('mysql://user-root') 

23 try: 

24 engl.execute('DROP DATABASE $s' €* DBNAME) 
25 except mysql exceptions.OperationalError, e: 
26 pass 

27 engl.execute('CREATE DATABASE *s' % DBNAME) 
28 engl.execute( 
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29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
€0 
61 
62 
63 
64 
65 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
37 
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d 


草 


"GRANT ALL ON *s.* TO ''8'localhost'" & DBNAME) 
engl.commit() 
cxn = eng.connection() 


try: 
users = Table('users', eng, autoload=True) 
except exceptions.SQLError, e: 
users m Table('users', eng, 
Column('login', String(8)), 
Column('uid', Integer), 
Columsn('prid', integer), 
redefine-True) 


self.eng*eng 
$elf.cxnecxn 
self.users = users 


def create(self): 
users = self.users 
try: 
users.drop(! 
except exceptions.SQLError, e: 


pass 
users.create() 


def insert(self): 
d * [dict(zip(FIELDS, 
[who, uid, rrange(1,5)])) for who,uid in randName()] 
return self.users.insert().execute (*d) . rowcount 


def update (self): 

users " self.users 

fr = rrange(1,5) 

to * rrange(1,5) 

return fr, to, \ 
users.updare(users.c.pridemfr).execute(prideto).rowcount 


def delete(self): 

users * self.users 

rm = rrange(1,5) 

return rm, \ 
users.delete(users.c.prid**rm).execute().rowcount 


def dbDump (self): 
res =» self.users.select().execute() 
print 'inisis*s' & ('LOGIN'.1just(COLSIZ) , 
'"USERID'.ljust(COLSIZ), 'PROJé'.1just(COLSIZ2)) 
for data in res.fetchall(]: 
print 'is$sis' * tuple([str(s).title().ljust 
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(COLSIZ) for s in data]) 


78 

79 def  getattr (self, attr): 

80 return getattr(self.users, attr) 

81 

82 def finish(self): 

83 self.cxn.commit() 

B4 self.eng.commit() 

85 

86 def main(): 

87 print '*** Connecting to $r database’ $ DBNAME 
88 orm = MySQLAlchemy('mysql', DBNAME) 

89 

90 print '\n*** Creating users table' 

91 orm.create() 

92 

93 print 'Mn*** Inserting names into table' 
94 orm.insert() 

95 orm.dbDump() 

96 

97 print '\n*** Randomly moving folks', 

98 fr, to, num = orm.update() 

99 print 'from one group ($d) to another ($d)' * (fr, to) 


100 print '\t(%d users moved)’ $% num 
101 orm.dbDump() 


102 

103 print 'in*** Randomly choosing group', 
104 rm, num = orm.delete() 

105 print '($d) to delete' 4 rm 

106 print '\t($d users removed)' $ num 
107 orm.dbDump() 

108 


109 print '\n*** Dropping users table' 
110 orm.drop() 

111 orm.finish() 

112 

113 if name  Á-- ' main ': 

114 main() 


46 ~ 70 行 


这 4 个 方法 处 理 数据 库 核 心 功能 : 创建 表 (46~52 行 、 插 入 数据 (54-5741) 、 更 新 数据 
(59-6441) 、 删 除数 据 (66~70 行 ) 。 我 们 也 有 一 个 方法 用 来 删除 表 。 


def drop(self): 


self.users.drop() 
ak 
drop = lambda self: self.users.drop() 
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不 过 ， 我 们 还 是 决定 提供 另 一 种 授权 处 理 方式 【 曾 在 第 13 章 中 介绍 ) 。 授 权 就 是 指 一 个 方法 
调用 不 存在 时 ， 转 交 给 另 一 个 拥有 此 方法 的 对 象 去 处 理 。 参 见 第 79~80 行 的 解释 。 


72 ~ 77 行 


输出 e 。 它 从 数据 库 中 得 到 数据 ， 就 像 ushuffle_db.py 中 那样 对 数据 
进行 美化 ， 事 实 上 ， 这 部 分 代码 几乎 完全 相同 。 

79 ~ 80 行 

应 该 尽量 避免 为 一 个 表 创 建 一 个 drop() 方 法 ， 因 为 这 总 是 会 调用 table 自 身 的 drop() 方 法 。 同 

样 ， 既 然 没有 新 增 功能 ， 那 我 们 有 什么 必要 创建 另 一 个 函数 ?无 论 属 性 查找 是 否 成 功 ， 特 殊 

方法 getattr() 总 是 会 被 调用 。 如 果 调 用 orm.drop() 却 发 现 这 个 对 象 并 没有 drop() 方 法 ， 


getattr (orm,'drop') 就 会 被 调用 。 发 生 这 种 情况 时 ， getattr () 被 调用 ， 之 后 将 这 个 属性 
名 委托 给 self.users。 解 释 器 会 发 现 self,users 有 一 个 drop 属 性 并 执行 。 


例 21.3 SQLObject ORM 示 例 (ushuffle so.py ) 


这 个 user shuffle 应 用 程序 的 主角 前 端 是 SQLObject， 后 端 是 MySQL 数 据 库 。 
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$!/usr/bin/env python 


1 

2 

3 import os 

E from random import randrange as rrange 
5 from sqlobject import * 

6 from ushuffle db import NAMES, randName 
E 

8 

9 


DBNAME = 'test' 


COLSIZ = 10 
10 FIELDS - ('login', 'uid', 'prid') 
11 
12 class MySQLObject (object): 
13 def —Jinit (self, db, dbName): 
14 import MySOLdb 
15 import mysql exceptions 
16 url = 'mysqi://localhost/$s' $ DBNAME 
17 
18 while True: 
19 cxn = connectionForURI (url) 
20 sqlhub.processConnection-cxn 
21 cxn .debug=True 
22 try: 
23 class Users(SQLObject): 
24 class sqlmeta: 
25 fromDatabase = True 
26 login = StringCol (length-8) 
27 uid = IntCol() 
28 prid = IntCol() 
29 break 
30 except mysql exceptions.ProgrammingError, e: 
31 class Users (SQLObject): 
32 login = StringCol (length-8) 
33 uid = IntCol() 
34 prid = IntCol() 
35 break 
36 except mysql exceptions.operationalError,e: 
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37 


cxnlesqlhub.processConnections 


connect ionForURI ('*mysq1: //rootélocalhost") 


38 
39 


cxnl.query("CREATE DATABASE $s" % DBNAME) 


exnl.query("GRANT ALL ON $s.* TO ''@' 


localhost'" $ DBNAME) 


40 
4l 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
69 


cxnl.close() 
self.users = Users 
self.cxn * cxn 


def createí(self): 
Users = self.users 
Users.dropTable(True) 
Users.createTable() 


def insertí(self): 
for who, uid ín randName(): 
self.users(**dict(zip(FIELDS, 
[who, uid, rrange(1,5)]))! 


def update(self): 
fr = rrange(1,5) 
to = rrange(1,5) 
users = self.users.selectBy(pridefr) 
for i, user ín enumerate (users): 
user.prid = to 
return fr, to, i*1 


def delete(self): 
rm * rrange(1,5) 
users = self.users.selectBy(priderm) 
for i, user in enumerate (users): 
user.destroySelf() 
return rm, i+l 


def dbDump (self): 
print 'An*sis'*s' à ('LOGIN',ljust(COLSIZ), 
'"USERID'.1just(COLSIZ), 'PROJ&'.1just(COLSIZ) ) 
for usr in self.users.select(): 
print '*$sists' * (tuple([str(getattr(usr, 
field)).title().1just(COLSIZ) ^ 
for field in FIELDS]]) 


drop = lambda self: self.users.dropTable() 
finish = lambda self: self.cxn.close() 


80 def main): 


81 
92 
83 


第 21 


print '*** Connecting to èr database' DBMAME 
orm = MySQLObject('mysqi', DBNAME) 
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84 print 'Mn*** Creating users table' 
85 orm.create() 
86 
87 print '\n*** Inserting names into table' 
88 orm.insert() 
89 orm.dbDump () 
90 
91 print 'Mn*** Randomly moving folks', 
92 fr, to, num = orm.update () 
93 print 'from one group ($d) to another ($d)' $ (fr, to) 
94 print 'Mt(*&d users moved)' $ num 
95 orm.dbDump() 
96 
97 print 'An*** Randomly choosing group', 
98 rm, num = orm.delete () 
99 print '($d) to delete' $ rm 
100 print '\t(%d users removed)' $ num 
101 orm.dbDump() 
102 
103 print 'Mn*** Dropping users table' 
104 orm.drop() 
105 orm.finish() 
106 
107 if | name == ' main ' 
108 main() 
82 ~ 8447 


最 后 一 个 方法 是 finish， 它 来 提交 整个 事务 


86 ~ 114 行 


main() 


os i E 


数据 库 操作 。 这 上 段 脚本 和 ushuffle_db.py 功 能 一 样 。 你 会 注意 到 数据 库 参 数 db 是 可 选 的 ， 而 且 
在 ushuffle_sa.py 和 即将 碰 到 的 ushuffle_so.py 中 ， nd 。 它 只 是 一 个 占 位 符 以 方便 
你 对 这 个 应 用 程序 添加 其 他 的 数据 库 支持 (参见 本 章 后 面 的 习题 ) 。 


运 和 


E213 


这 段 脚 本 ， 你 会 看 到 类 似 下 面 的 输出 : 


Jd R 3 
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$ ushuffle sa.py 

x* xx 连接 test 数据 库 
***&8]£& users X 

***I|] users 表 插 入 姓名 数据 


LOGIN USERID PROJ# 
Serena 7003 4 
Faye 6812 4 
Leslie 7808 3 
Ernie 7410 1 
DaVe 7306 2 
Melissa 8602 l 
Amy 7209 3 
Angela 7603 4 
Jess ye a e 2 
Larry AS l 
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Jim 7512 2 
Davina 7902 3 
Stan 7607 4 
Pat 7711 2 
Aaron 8312 2 
Elliot 7911 3 
*##* 随 机 将 几 个 人 从 一 个 组 《1) 移动 到 另 一 个 组 (3) 
(3 个 组 被 移动 ) 
LOGIN USERID PROJ4 
Serena 7003 4 
Faye 6812 4 
Leslie 7808 3 
Ernie 7410 3 
Dave 7306 2 
Melissa 8602 3 
Amy 7209 3 
Angela 7603 4 
Jess 7912 2 
Larry 7311 3 
Jim 7512 2 
Davina 7902 3 
Stan 7607 å 
Pat 7711 2 
Aaron 8312 2 
Elliot 7911 3 


* 随机 选中 一 个 组 〈2) 删除 


(5 RIP HE) 
LOGIN USERID PROJ$ 
Serena 7003 4 
Faye 6812 4 
Leslie 7808 3 
Ernie 7410 3 
Melissa 8602 3 
Amy 7209 3 
Angela 7603 4 
Larry 7311 时 
Davina 7902 3 
Stan 7607 E 
Elliot 7911 3 
tt BERI 
$ 

3.217 EAE 

1 ~ 1047 


除了 我 们 使 用 的 是 SQLObject 而 不 是 SQLAIchemy 以 外 ， 导 入 模块 和 常量 声明 几乎 与 
ushuffle_sa.py 相 同 。 


12 ~ 42 行 


类 似 我 们 的 SQLAIchemy 例 子 ， 类 的 构造 器 做 大 量 工作 以 确保 有 一 个 数据 库 可 用 ， 然 后 返回 一 
个 连接 。 同 样 的 ， 这 也 是 你 能 在 程序 里 看 到 SQL 语句 的 唯一 位 置 。 我 们 这 个 程序 ， 如 果 因 为 
某 种 原因 造成 SQLObject 无 法 成 功 创建 用 户 表 ， 就 会 陷入 无 限 循环 当中 。 
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我 们 尝试 能 够 聪明 地 处 理 错误 ， 解 决 扩 这 个 重建 表 的 问题 。 因 为 SQLObject 使 用 元 类 ， 我 们 知 
道 类 的 创建 幕后 发 生 特殊 事件 ， 所 以 我 们 不 得 不 定义 两 个 不 同 的 类 ， 一 个 用 于 表 已 经 存在 的 
情况 ， 一 个 用 于 表 不 存在 的 情况 。 代 码 工作 原理 如 下 。 


1. 尝 试 建立 一 个 连接 到 一 个 已 经 存在 的 表 。 如 果 正 常 工作 ， 成 功 ($23—2945). 
2. 如 果 第 一 步 不 成 功 ， 则 从 零 开始 为 这 个 表 创建 一 个 类 ， 如 果 成 功 ， 成 功 (第 31~36 行 ) . 


3. 如 果 第 二 步 仍 不 成 功 ， 我 们 的 数据 库 可 能 遇 到 麻烦 ， 那 就 重新 创建 一 个 新 的 数据 库 (第 
37 一 40 行 ) . 


4. 重 新 开始 新 的 循环 。 


希望 程序 最 终 能 在 第 一 步 或 第 二 步 成 功 完成 。 当 循环 结束 时 ， 类 似 ushuffle_sa.py， 我 们 得 到 
合适 的 对 象 实例 。 


44 ~ 67 行 、77 ~78 行 


这 些 行 处 理 数 据 库 操作 。 我 们 在 44~~47 行 创建 了 表 ， 并 在 77 行 删 掉 了 表 。 在 49~52 行 持 入 数 
据 ， 在 54~60 行 更 新 数据 ， 在 62~67 行 删除 了 数据 。78 行 调用 了 finish() 方 法 来 关闭 数据 库 连 
接 。 我 们 不 能 像 SQLAIchemy 那 样 使 用 授权 删 表 代 理 ， 因 为 SQLObject 的 删 表 代 理 名 为 
dropTable() 而 不 是 drop(). 


69 ~ 75 行 
使 用 dbDump() 方 法 ， 我 们 从 数据 库 中 得 到 数据 ， 并 将 它 显 示 在 屏幕 上 。 
80 ~ 108 行 


又 到 了 main() 函 数 。 它 工作 的 方式 非常 类 似 ushuffle_ sa.py。 同 样 ， 构 造 器 的 db 参数 仅仅 是 一 
个 占 位 符 ， 用 以 支持 其 他 的 数据 库 系 统 〈 参 阅 本 章 最 后 的 习题 ) . 


当 你 运行 这 段 脚 本 时 ， 你 的 输出 可 能 类 似 这 样 : 


o ox 
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$ ushuffle_so.py 
*** 连接 test 数据 库 
*** 创建 users X 
*** 向 表 里 插入 姓名 数据 


LOGIN USERID PROJ$ 
Jess 7912 1 
Amy 7209 < 
Melissa 8602 2 
Dave 7306 4 
Angela 7603 4 
Serena 7003 2 
Aaron 8312 1 
Leslie 7808 1 
Stan 7607 3 
Pat 7711 3 
Jim 7512 4 
Larry 7311 3 
Ernie 7410 2 
Faye 6812 4 
Davina 7902 1 
Elliot 7911 4 
*** 随 机 将 三 个 人 从 一 个 组 (2〉 移动 到 另 一 个 组 〈3) 
(3 个 用 户 被 移动 ) 
LOGIN USERID PROJf 
Jess 7912 1 
Amy 7209 å 
Melissa 8602 3 
Dave 7306 4 
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Angela 7603 4 
Serena 7003 3 
Aaron 8312 1l 
Leslie 7808 aP 
Stan 7607 3 
Pat 7711 3 
Jim 7512 4 
Larry 7311 3 
Ernie 7410 3 
Faye 6812 4 
Davina 7902 1 
Elliot 7911 图 
*** 随 即 选择 删除 组 (3) 
(6 个 用 户 被 删除 》 
LOGIN USERID PROJ# 
Jess 7912 1 
Amy 7209 B 
Dave 7306 D 
Angela 7603 å 
Aaron 8312 1 
Leslie 7808 1 
Jim 7512 ü 
Faye 6812 D 
Davina 7902 1 
Elliot 7911 à 
c 删除 用 户 表 
$ 


21.3.4 ”总 结 


关于 如 何在 Python 中 使 用 关系 型 数据 库 ， 项 望 我 们 前 面 介绍 的 东西 对 你 有 用 。 当 你 应 用 程序 
的 需求 超出 纯 文 本 或 类 似 DBM 等 特殊 文件 的 能 力 时 ， 有 多 种 数据 库 可 供 选择 ， 别 忘 了 还 有 一 
个 完全 由 Python 实 现 的 丨 正 的 免 安装 维护 和 管理 的 站 实 数据 库 系统 。 你 能 在 下 面 找到 多 种 
Python 数据 库 接口 程序 和 ORM 系 统 。 我 们 也 建议 你 研究 一 下 互联 网 上 的 DB-SIG 的 网 页 和 邮件 
列表 。 类 似 其 他 的 软件 开发 领域 ， 只 不 过 Python 更 简单 易学 ， 用 户 体验 更 好 。 


21.4 相关 模块 
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表 21.8 列 出 了 常见 的 Python 数据 库 接 口 程序 ， 注 意 不 是 所 有 的 接口 程序 都 是 DB-API 兼 容 的 。 


A218 数据 库 相关 模 块 和 网 址 
名 F 网 站 参考 或 扒 述 


htps/mysaql.com or http://mysql.org 





续 表 
# F MN 265 Rif 
MySQL python 
PostgreSQL hitp://postgresql.org. 
Psycopg htrp://init.org/projects/psycopg 
psycopg? http://inité.org/software/initd/psycopg/ 
PyPgSQL hitp://pypgsql.sf.nct 
PyGreSQL. http://pygresql.org 
PoPy QE, 13 PyGreSQL 项 目 合并 
SQLite htp://sqlite.org 
pysalite hatp:Winitd org/projects/pysalite 
sqlite?* pysalite ERAH Python 标准 序 ; RIRE FRERET, FWE 
Uem os 
APSW http://rogerbinns.com/apsw.hunl 
MaxDB (SAP) http://mysql.com/products/maxdb 
sdb http://dev.mysal.com/downloads/maxdb/7.6.00.htmWPython 
sapdb http://sapdb,org/sapdbPythoa-html 
Firebird (InterBase) http;//fircbird sf. net 
KinterbasDB http;//kinterbasdb.sf. net 
SQL Server http:/microsoft.com/sql 
pymssq! http://pymssql.sf.net (requires Free TDS [http://freetds.org]) 
adodbapi http://adodbapi.sf.net 
Sybase http://sybase.com 
sybase http:/object-craft.com.au/projects/sybase 
Oracle http://oracle.com 
«x Oracle hitp://starship python.net/crew/atuining/cx Oracle 
DCOracle2 hitp:/zope.org/Members/matt/dco2(older, for Oracle only) 
Ingres http-//ingres.com 
Ingres DBI htp://ingres.com/products/Prod Download Python. DBIhtml 
ingmod http://www informatik.uni-rostock.de/ — hme/software/ 





a. pysqlite CLER IO Python2.5 中 ， 作 为 它 的 sqlite3 MER. 


21.5 练习 
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21-1. 什 么 是 Python DB-API ? 它 是 一 个 好 东西 吗 ? 为 什么 是 (或 为 什么 不 是 ) ? 
21-2. 描 述 一 下 数据 库 模 块 参数 风格 之 间 的 不 同 在 哪儿 ? 

21-3. 游 标 对 象 的 executed() 系 列 方法 有 何 区 别 ? 

21-4. 游 标 对 象 的 fetch*() 系 列 方法 有 何 区 别 ? 


21-5. 研 究 一 下 你 使 用 的 数据 库 及 相应 的 Python 模块 。 它 是 否 与 DB-API 兼 容 ? 该 模块 是 否 
提供 了 DB-API 必 须 功 能 之 外 的 更 多 特性 ? 


21-6. 针 对 你 使 用 的 数据 库 和 DB-API 接 口 程序 ， 学 习 使 用 Type 对 象 写 一 段 小 的 脚本 ， 至 少 
要 用 到 其 中 的 一 个 对 象 。 


21-7. 重 构 。 例 21.1 (ushuffle db.py) T jcreate():&& > — table SARA Es > AUS i 
具 调 用 create() 函 数 重建 这 个 table。 如 果 在 重建 这 个 table 时 失败 ， 就 会 陷入 无 限 循 环 之 
中 。 通 过 在 异常 处 理 中 不 再 调用 create 命 令 (cur.execute()) 修复 这 个 问题 ， 搞 一 个 更 实 
用 的 解决 方案 出 来 。 附 加 题 : 实现 如 果 创 建 table 失 败 ， 在 返回 失败 之 前 最 多 重 试 3 次 。 


21-8. 数 据 库 和 HTML。 利 用 现 有 数据 库 的 一 个 表 和 你 在 第 20 章 学 到 的 开发 知识 ， 读 出 数 
据 库 表 的 内 容 ， 将 它 放 到 一 个 HTML table 中 去 。 


21-9. 数 据 库 网 站 开发 。 给 我 们 的 user shuffle 例 子 写 一 个 网 页 界面 。 
21-10. 数 据 库 界面 编程 。 给 我 们 的 user shuffle 例 子 写 一 个 图 形 界 面 。 


21-11. 股 票 投资 组 合 类 。 修 改 第 13 章 股票 数据 的 例子 ， 将 它 改 造 为 使 用 某 一 种 关系 数据 
库 保 存 数据 。 


21-12. 切 换 ORM 后 端 为 其 他 的 数据 库 。 将 SQLAIchemy (ushuffle sa.py) 或 SQLObject 
(ushuffle so.py) 应 用 程序 后 端 数据 库 由 MySQL 切 换 为 另 一 种 数据 库 系 统 。 
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本 章 主题 

4 引言 /动机 

+ 扩展 Python 

4 创建 应 用 程序 代码 

4 用 样板 包装 你 的 代码 
4 编译 

4 导入 并 测试 

e 引用 计数 

+ 线程 和 GIL 

e 相关 话题 


在 本 章 中 ， 我 们 将 讨论 如 何 编写 扩 展 代码 并 将 它们 的 功能 整合 到 Python 编程 环境 中 来 。 首 先 
我 们 会 给 出 这 样 做 的 原因 ， 然 后 一 步 步 地 教 您 如 何 做 。 应 当 指 出 的 是 ， 虽 然 大 部 分 Python 的 
扩展 都 是 用 C 语 言 写 的 ， 并 且 下 面 的 所 有 样 例 代码 也 都 是 由 纯 C 语 言 写 的 ， 但 请 放心 ， 这 些 代 
码 很 容易 就 可 以 移植 到 C++ 中 。 


22.44 引言 /动机 


224.4 什么 是 扩展 


一 般 来 说 ， 所 有 能 被 整合 或 导入 到 其 他 Python 脚 本 的 代码 ， 都 可 以 称 为 扩展 。 您 可 以 用 纯 
Python 来 写 扩 展 ， 也 可 以 用 C 和 C++ 之 类 的 编译 型 语言 来 写 扩 展 (或 者 也 可 以 用 Java 给 Jython 
写 扩展 ， 也 可 以 用 C# 或 Visual Basic.NET 给 IronPython 写 扩展 ) ° 


Python 的 一 大 特点 就 是 ， 扩 展 和 解释 器 之 间 的 交互 方式 与 普通 的 Python 模块 完全 一 样 。 
Python 在 设计 之 初 就 考虑 到 要 让 模块 的 导入 机 制 足 够 抽象 ， 抽 象 到 让 使 用 模块 的 代码 无 法 了 
解 到 模块 的 具体 实现 细节 。 除 非 那 个 程序 员 在 磁盘 中 搜索 这 个 模块 文件 ， 否 则 ， 他 就 连 这 个 
模块 到 底 是 用 Python 写 的 ， 还 是 用 某 种 编译 语言 写 的 都 分 辨 不 出 来 。 


核心 笔记 : 在 不 同 平台 上 创建 扩展 


我 们 要 注意 的 是 ， 如 果 你 曾 自己 编译 过 Python 解释 器 ， 那 么 ， 在 这 样 的 环境 中 ， 扩 展 一 般 都 
是 可 以 使 用 的 。 自 己 手动 编译 扩展 ， 和 获取 扩展 的 二 进 制 文件 是 有 些 不 同 的 。 虽 然 自己 编译 
比 简单 地 下 载 安装 复杂 一 些 ， 但 由 此 得 来 的 好 处 就 是 ， 你 可 以 自由 选择 你 想 使 用 的 Python 版 
本 。 虽 然 本 章 中 的 例子 都 是 在 Unix 系 统 中 开发 的 (一般 的 Unix 中 都 自 带 编译 器 ) 。 但 只 要 你 
能 使 用 C/C++ (或 Java) 的 编译 器 并 且 在 C/C++ (或 Java) 中 有 Python 的 开发 环境 ， 那 唯一 
的 区 别 只 是 怎样 来 编译 而 已 。 无 论 在 哪 一 个 平台 上 ， 申 正 起 作用 的 代码 都 是 一 样 的 。 如 果 你 
在 Win32 平 台 上 进行 开发 ， 你 需要 有 Visual C++ 开 发 环境 。Python 的 发 布 包 中 自 带 了 7.1 版 本 
的 项 目 文件 。 当 然 ， 你 也 可 以 使 用 老 版 本 的 VC。 想 了 解 更 多 的 关于 如 何在 Win32 上 开发 扩展 
的 信息 ， 你 可 以 访问 如 下 网 页 


http://docs.python.org/ext/building-on-windows.html 
警告 : EAMA RAA 6 LAA dcr anc Xe c q8 JE 3E — Sel o RAA G g 


脑 上 编译 Python 和 扩展 ， 因 为 有 时 就 算是 编译 器 或 是 CPU 之 间 的 些许 差异 ， 也 会 导致 代码 不 
能 正常 工作 。 


22.1.2 ”为 什么 要 扩展 Python 


纵 观 软件 工程 的 历史 ， 编 程 语言 都 不 具备 可 扩展 性 ， 你 只 能 使 用 已 有 的 功能 ， 而 不 能 为 语言 
增加 新 功能 。 现 如 今 的 编程 环境 中 ， 可 定制 性 也 是 一 个 很 大 的 卖点 ， 它 可 以 促进 代码 的 复 
用 。TCL 和 Python 等 语言 是 第 一 批 提 供 可 扩展 性 的 语言 。 那 么 ， 为 什么 我 们 会 想 要 扩展 像 
Python 这 种 已 经 很 完善 的 语言 呢 ? 有 以 下 几 点 好 理由 。 


e 添加 /额外 的 ( 非 Python) 功能 


扩展 Python 的 一 个 原因 就 是 对 一 些 新 功能 的 需要 ， 而 Python 语言 的 核心 部 分 并 没有 提供 
这 些 功能 。 这 时 ， 通 过 纯 Python 代 码 或 者 编译 扩展 都 可 以 做 到 。 但 是 有 些 情况 ， 比 如 创 
建新 的 数据 类 型 或 者 将 Python 诅 入 到 其 他 已 经 存在 的 应 用 程序 中 ， 则 必须 得 编译 。 


性 能 瓶颈 的 效率 提升 

众所周知 ， 由 于 解释 型 的 语言 是 在 运行 时 动态 地 翻译 解释 代码 ， 这 导致 其 运行 速度 比 编 
译 型 的 语言 慢 。 一 般 说 来 ， 把 所 有 代码 都 放 到 扩展 中 ， 可 以 提升 软件 的 整体 性 能 。 但 有 
时 由 于 时 间 与 精力 有 限 ， 这 样 做 并 不 划算 。 

通常 ， 先 做 一 个 简单 的 代码 性 能 测试 ， 看 看 瓶颈 在 哪里 ， 然 后 把 瓶颈 部 分 在 扩展 中 实现 
会 是 一 个 比较 简单 有 效 的 做 法 。 效 果 立 年 见 影 不 说 ， 而 且 还 不 用 花费 太 多 的 时 间 与 精 


保持 专 有 源 代 码 私密 


创建 扩展 的 另 一 个 很 重要 的 原因 是 脚本 语言 都 有 一 个 共同 的 缺陷 ， 那 就 是 所 有 的 脚本 语 
言 执行 的 都 是 源 代码 ， 这 样 一 来 源 代码 的 保密 性 便 无 从 谈 起 了 。 


把 一 部 分 代码 从 Python 转 到 编译 语言 就 可 以 保持 专 有 源 代码 私密 ， 因 为 你 只 要 发 布 二 进 
制 文件 就 可 以 了 。 编 译 后 的 文件 相对 来 说 更 不 容易 被 反 向 工程 出 来 。 因 此 ， 代 码 能 实现 
保密 。 尤 其 是 涉及 到 特殊 的 算法 、 加 密 方法 及 软件 安全 的 时 候 ， 这 样 做 就 显得 非常 至 关 
重要 了 。 

另 一 种 对 代码 保密 的 方法 是 只 发 布 预 编译 后 的 。pyc 文 件 。 这 是 介 于 发 布 源 代 码 (py 
件 ) 和 把 代码 移植 到 扩展 这 两 种 方法 之 间 的 一 种 较 好 的 折 中 方法 。 


22.2 ”创建 Python 扩展 


为 Python 创建 扩展 需要 3 个 主要 的 步骤 : 
1. 创 建 应 用 程序 代码 ; 

2. 利 用 样板 来 包装 代码 ; 

3. 编 译 与 测试 。 


在 这 一 节 中 ， 我 们 会 将 这 3 步 逐一 介绍 给 大 家 。 


22.2.1 创建 您 的 应 用 程序 代码 


首先 ， 我 们 要 建立 的 是 一 个 “ 库 ”， 要 记 住 ， 我 们 要 建立 的 是 将 在 Python 内 运行 的 一 个 模块 。 所 
以 在 设计 你 所 需要 的 函数 与 对 象 的 时 候 要 注意 到 ， 你 的 C 代 码 要 能 够 很 好 地 与 Python 的 代码 进 
行 双向 的 交互 和 数据 共享 。 


然后 ， 写 一 些 测试 代码 来 保障 你 的 代码 的 正确 性 。 你 可 以 在 C 代 码 中 放 一 个 main() 函 数 ， 使 得 
你 的 代码 可 以 被 编译 并 链接 成 一 个 可 执行 文件 (而 不 是 一 个 动态 库 ) ， 当 你 运行 这 个 可 执行 
文件 时 ， 程 序 可 以 对 你 的 软件 库 进 行 回 归 测 试 。 这 是 一 种 很 符合 Python 风格 的 做 法 。 


在 下 面 的 例子 中 ， 我 们 就 将 采用 这 种 做 法 。 测 试用 例 分 别针 对 我 们 想 要 导出 到 Python 世界 的 
两 个 函数 。 一 个 是 递归 求 阶乘 的 函数 fac()。 另 一 个 reverse() 函 数 则 实现 了 一 个 简单 的 字符 串 
反 转 算法 ， 其 主要 目的 是 修改 传 入 的 字符 串 ， 使 其 内 容 完 全 反 转 ， 但 不 需要 用 申请 内 存 后 反 
着 复制 的 方法 。 由 于 涉及 到 指针 的 使 用 ， 我 们 务必 要 在 设计 和 调试 时 小 心 谨 懂 ， 以 防 把 问题 
带 入 Python. 


例 22.1 中 所 列 出 的 Extestl.c 是 我 们 的 第 一 个 版 本 。 


代码 中 ， 包 含 了 两 个 函数 fac() 和 [reverse()。 分 别 实现 了 我 们 刚刚 所 说 的 两 个 功能 。fac() 接 受 
一 个 整 型 参数 并 递归 计算 结果 ， 在 退出 最 后 一 层 调用 后 最 终 返 回 到 调用 代码 中 。 

最 后 一 段 代码 是 必要 的 main() 函 数 。 我 们 在 这 里 面 写 测试 代码 ， 传 不 同 的 参数 给 fac() 和 
reverse()。 有 了 这 个 函数 ， 我 们 就 可 以 了 解 我 们 的 代码 是 否 能 得 到 正确 的 结果 。 


现在 ， 我 们 就 可 以 编译 这 段 代码 了 。 在 大 部 分 有 gcc 编 译 器 的 Unix 系 统 中 ， 我 们 都 可 以 用 以 下 
指令 进行 编译 : 


$ gcc Extestl.c -o Extest 
> 


我 们 可 以 输入 一 下 命令 来 运行 我 们 的 程序 ， 并 得 到 如 下 输出 


8! == 40320 

12! == 479001600 

reversing 'abcdef', we get 'fedcba' 
reversing 'madam', we get 'madam' 


$ 


例 22.1 纯 C 版 本 库 (Extestl.c) 


下 面 列 出 了 我 们 想 要 包装 并 在 Python 解释 器 中 使 用 的 C 函 数 的 代码 ，main() 是 测试 函数 。 


1 #include<stdio.h> 

2 #include<stdlib.h> 

3 #include<string.h> 

4 

5 int fac(int n) 

6 

7 if (n < 2) return(1); /* 0! == 1! == 1 */ 

8 return (n)*fac(n-1); /* n! == n*(n-1)! */ 

9 

10 

11 char *reverse[(char *s) 

12 d 

13 register char t, /* 中 间 变 量 上 */ 

14 *D = $, /* Eua */ 

15 *q = (s + (strlen(s)-1)):; /* bwd */ 
16 

17 while (p < q) I LE 
18 ( /*swap & mv ptrs */ 
19 t = *p; 

20 *p*t* = *q; 

21 *q-- = t; 

22 } 

23 return s; 

24 ! 

25 


26 int main() 


27 [ 

28 char s[BUFSIZ] ; 

29 printf("4! == $dWMn", fac(4)); 

30 printf("8! == $dMn", fac(8)); 

31 printf("12! mm $dMn", fac(12)); 

32 strcpy(s, "abcdef"); 

33 printf("reversing 'abcdef', we get '$s'WMn", V 
34 reverse(s)); 

35 strcpy(s, "madam"); 

36 printf("reversing 'madam', we get '$s'Xn", \ 
37 reverse(s)); 

38 return 0; 

39 } 


我 们 要 再 强调 一 次 ， 你 应 该 尽 可 能 地 完善 你 的 代码 。 因 为 ， 在 把 代码 集成 到 Python 中 后 再 来 
调试 你 的 核心 代码 ， 查 找 潜 在 的 bug 是 件 很 痛苦 的 事情 。 也 就 是 说 ， 调 试 核心 代码 与 调试 集成 
这 两 件 事 应 该 分 开 来 做 。 要 知道 ， 与 Python 的 接口 代码 写 得 越 完 善 ， 集 成 的 正确 性 就 越 容 易 
保证 。 


我 们 的 两 个 函数 都 只 接受 一 个 参数 ， 并 返回 一 个 值 。 这 是 很 标准 的 情况 ， 与 Python 集成 的 时 
候 应 该 不 会 有 什么 问题 。 注 意 ， 到 现在 为 止 ， 我 们 所 做 的 都 还 与 Python 没什么 关系 。 我 们 只 
是 简单 地 创建 了 一 个 C/C++ 的 应 用 程序 而 已 。 


22.2.2 ”用 样板 来 包装 你 的 代码 


整个 扩展 的 实现 都 是 围绕 着 13.15.1 节 所 说 的 “包装 ?这 个 概念 进行 的 。 你 的 设计 要 尽 可 能 让 你 
的 实现 语言 与 Python 无 颖 结合。 接口 的 代码 被 称 为 “样板 "代码 ， 它 是 你 的 代码 与 Python 解释 器 
之 间 进 行 交互 所 必 不 可 少 的 一 部 分 


我 们 的 样板 主要 分 为 4 步 。 

1. 包 含 Python 的 头 文件 。 

2. 为 每 个 模块 的 每 一 个 函数 增加 一 个 形 如 PyObject* Module func() 的 包装 函数 。 
3. 为 每 个 模块 增加 一 个 形 如 PyMethodDefModuleMethods[] 的 数组 。 

4. 增 加 模块 初始 化 函数 void initModule(). 

1. &, 2: PythonX x fF 


首先 ， 你 要 找到 Python 的 头 文件 在 哪 ， 并 且 确 保 你 的 编译 器 有 权限 访问 它们 。 ge 
Unix 的 系统 里 ， 它 们 都 会 在 /usr/local/include/python2.x 或 /usr/include/python2.x 目 录 中 。 
中 ，“2.x" 是 你 所 使 用 的 Python 的 版 本 号 。 如 果 你 曾 编译 并 安装 过 Python 解 释 器 ， 那 应 该 不 会 
碰 到 什么 问题 ， 因 为 这 时 ， 系 统一 般 都 会 知道 你 的 文件 安装 在 哪 。 像 下 面 这 样 在 你 的 代码 里 
加 入 一 行 : 


#include "Python.hn 


这 部 分 比较 简单 。 接 下 来 再 看 看 怎么 在 样板 中 加 入 其 他 的 部 分 。 


2. 为 每 个 模块 的 每 一 个 函数 增加 一 个 型 如 PyObject* Module func() 的 包装 函数 


这 一 部 分 最 需要 技巧 。 你 需要 为 所 有 想 被 Python 环 境 访 问 的 函数 都 增加 一 个 静态 的 函数 ， 函 
数 的 返回 值 类 型 为 PyObject*， 函 数 名 前 面 要 加 上 模块 名 和 一 个 下 划 线 (_) . 


比方 说 ， 我 们 希望 在 Python 中 ， 能 够 导入 (import) 我 们 的 fac() 函 数 ， 其 所 在 的 模块 名 为 
Extest， 那 么 我 们 就 要 创建 一 个 包装 函数 叫 Extest_fac(). 在 使 用 这 个 函数 的 Python 脚 本 中 ， 使 
用 方法 是 先 "import Extest" 然 后 调用 "Extest. fac()”( 或 者 先 “from Extest import fac”， 然 后 直 
接 调用 “fac()”) 


包装 隐 数 的 用 处 就 是 先 把 Python 的 值 传 递 给 C， 然 后 调用 我 们 想 要 调用 的 相关 部 数 。 当 这 个 郊 
数 完成 要 返回 Python 的 时 候 ， 把 函数 的 计算 结果 转换 成 Python 的 对 象 ， 然 后 返回 给 Python. 


对 于 fac() 圳 数 来 说 ， 当 客户 程序 调用 Extestfac() 的 时 候 ， 我 们 的 包装 函数 就 会 被 调用 。 它 接受 
一 个 Python 的 整 型 参数 ， 把 它 转 为 C 的 整 型 ， 然 后 调用 C 的 fac() 函 数 ， 得 到 一 个 整 型 的 返回 

值 ， RURSUS Me AE OR Se ctp de dese USE 吉 果 返回 (在 你 头脑 中 ， 要 
保持 一 个 想法 : 我 们 所 写 的 其 实 就 是 “deffac (n) ”这 段 声 明 的 一 个 代理 函数 ， 当 代理 函数 返回 
的 时 候 ， 就 像 是 这 个 想像 中 Python 的 fac() 函 数 在 返回 一 样 ) . 


那么 怎样 才能 完成 这 样 的 转换 呢 ? 答案 是 ， 在 从 Python 到 C 的 转换 就 用 PyArg_Parse*() 系 列 函 


dk ; 在 从 C 转 到 Python 的 时 候 ， 就 用 Py_BuildValue() 函 数 。 


PyArg_Parse() 系 列 函 数 的 用 法 跟 C 的 sscanf() 函 数 很 像 ， 都 接受 一 个 字符 串 流 ， 并 根据 一 个 指 
定 的 格式 字符 串 进行 解析 ， 把 结果 放 入 到 相应 的 指针 所 指 的 变量 中 去 。 它 们 的 返回 值 为 1 表示 
解析 成 功 ， 返 回 值 为 0 表示 失败 。 


Py_BuildValue() 的 用 法 跟 sprintf() 很 像 ， 把 所 有 的 参数 按 格 式 字 符 串 所 指定 的 格式 转换 成 一 个 


Python 的 对 象 。 
表 22.1 罗 列 了 这 


表 22.1 


Python 到 C 


int 
PyArg. ParseTuple() 


Je gf dc e 。 


Python 和 C/C++ 之 间 的 数据 转换 


i 








int 
PyArg ParseTupleAndKeywords() 


+ 


Æ Python 传 过 来 的 参数 转 为 C 


与 PyArg_ParyeTuple0 作 用 相同 ， 但 是 同时 甫 析 关 键 学 参数 





C 到 Python 





PyObject* 
Py Build Value) 





E C 的 数据 转 为 Python 的 一 个 囊 一 组 对 象 ， 然 后 返回 之 


表 22.2 所 列 出 的 转换 代码 用 于 在 C 与 Python 之 间 做 数据 的 转换 。 























表 22.2 Python 和 CIC++ 之 间 数 据 转换 的 通用 代码 
格式 代号 Python 型 CCce t 
5 str char* 
z str/None char*/NULI. 
i "T int int 
j long long 
c str char 
E d E float double 
D complex Py Complex* 
o (any) PyObject 
S | str PyStringObject 











这 些 转换 代码 出 现在 格式 字符 串 当 中 ， 用 于 指定 各 个 值 的 数据 类 型 ， 以 便于 在 两 种 语言 之 间 
做 转换 。 注 : 由 于 Java 的 所 有 数据 类 型 都 是 类 ， 所 以 Java 的 转换 类 型 不 一 样 。Python 对 象 在 
Java 中 所 对 应 的 数据 类 型 请 参考 Jython 的 相关 文档 。C# 也 有 同样 的 问题 。 


下 面 是 完整 的 Extest fac() &U X Až : 


static PyObject * 


Extest fac(PyObject *selí, PyObject *args) 1 


int res; // parse result 
int num; // arg for fac() 
PyObject* retval; // return value 


res = PyArg ParseTuple(args, "i", &num); 
if (!res) ( // TypeError 
return NULL; 
} 
res = fac(num); 
retval = (PyObject*)Py BuildValue("i", res); 
return retval; 


) 


首先 ， TAM Am KIIRE oT Po RIEMER FA R” ， 表示 我 们 期 营 得 
到 一 个 整 型 的 变 CR e M 的 确 是 一 个 整 型 的 变量 ， 那 就 把 它 保存 到 num 变 量 中 。 和 否 
则 ， es 返回 NULL， 同 时 ， 我 们 的 函数 也 返回 一 个 NULL。 这 时 ， 就 会 产 
生 一 个 TypeError 异 常 ， 通 知客 户 我 们 期 望 传 入 一 个 整 型 交 量 。 


， 我 们 会 调用 fac() 函 数 ， 其 参数 为 num， 把 返回 结果 放 在 res 交 量 中 。 最 后 ， 通 过 调用 
Py. rds ， 格式 字符 串 为 “PP， 把 结果 转 为 Python 的 整 型 类 型 并 返回 。 ' A] 
就 完成 了 整个 调用 过 程 。 


事实 上 ， 和 包装 泡 数 写 得 多 了 之 后 ， 你 会 慢 慢 地 把 代码 写 得 越 来 越 短 ， 以 减少 中 间 变 量 的 使 
用 ， 同 时 也 会 增加 代码 的 可 读 性 。 我 们 以 Extest fac() 函 数 为 例 ， 把 它 改写 得 短小 一 些 ， 只 使 
用 一 个 变量 num: 


static PyObject * 
Extest fac(PyObject *self, PyObject *args) { 
int num; 
if (!PyArg ParseTuple(args, "i", &num)) 
return NULL; 
return (PyObject*)Py BuildValue("i", fac(num)); 


一 个 值 了 ， 那 我 们 把 reverse() 的 需求 稍 


那么 reverse() 怎 么 实现 呢 ? 既然 你 已 经 知道 怎 回 
两 个 字符 串 的 元 组 。 第 一 个 值 是 传 进来 的 


A 
微 改 一 下 ， 变 成 返回 两 个 值 。 我 们 将 返回 一 个 包 
字符 串 ， 第 二 个 值 是 反 转 后 的 字符 串 。 


返 
d 


我 们 将 把 这 命名 为 Extest.doppel()， 以 示 与 reverse() 函 数 的 区 别 。 把 代码 包装 到 
Extest unes en 我 们 得 到 如 下 代码 : 


static PyObject * 
Extest doppel(PyObject *self, PyObject *args) { 


char *orig str; 


if (!PyArg ParseTuple(args, "s", &orig str)) return NULL; 
return (PyObject*)Py BuildValue("ss", orig str, \ 
reverse(strdup(orig str))); 


3&Extest fac() 类 似 ， 我 们 接收 一 个 字符 串 型 的 参数 ， 保 存 到 orig_str 中 。 注 意 ， 这 次 ， 我 们 要 
使 用 “S" 格 式 字符 串 。 然 后 调用 strdup() 函 数 把 这 个 字符 串 复 制 一 份 (由 于 我 们 要 同时 返回 原始 
字符 串 和 反 转 后 的 字符 串 ， 所 以 我 们 需要 复制 一 份 ) 。 把 新 复制 的 字符 串 传 给 reverse 函 数 ， 
我 们 就 得 到 了 反 转 后 的 字符 串 。 


如 你 所 见 ， 我 们 用 “ss” 格 式 字 符 串 让 Py_ 的 网 Kos qq o A DIG e 
分 别 放 了 原始 字符 串 和 反 转 后 的 字符 串 。 这 样 就 完成 所 有 的 工作 了 吗 ? 很 不 幸 ， 还 没有 。 


我 们 碰 到 了 C 语 言 的 一 个 陷阱 : 内 存 洪 漏 。 即 内 存 被 申请 了 ， 但 没有 被 释放 。 就 像 去 图 书馆 借 
了 书 ， 但 是 没有 还 一 样 。 无 论 何 时 ， 你 都 应 该 释放 所 有 你 申请 的 ， 不 再 需要 的 内 存 。 看 ， 我 
们 写 的 代码 犯 了 多 大 的 罪过 啊 (虽然 看 上 去 好 像 很 无 章 的 样子 ) | 


Py_BuildValue() 元 数 生 成 要 返回 的 Python 对 象 的 时 候 ， 会 把 转 入 的 数据 复制 一 份 。 上 例 中 ， 
那 两 个 字符 串 就 会 被 复制 出 来 。 问 题 就 在 于 ， 人 MPO ， 但 
是 ， 在 退出 的 时 候 没有 释放 它 。 于 是 ， 这 片 内 存 就 泄漏 了 。 正 确 的 做 法 是 : 先生 成 要 返回 的 
对 象 ， 然 后 释放 在 包装 函数 中 申请 的 内 存 。 我 们 必须 要 这 样 修改 我 们 的 代码 : 


static PyObject * 
Extest doppel(PyObject *self, PyObject *args) ( 
char *orig str; // 原始 字符 串 


char *dupe str; // 反 转 后 的 字符 串 
PyObject* retval; 
if (!PyArg ParseTuple(args, "s", &orig str)) return NULL; 
retval = (PyObject*)Py BuildValue("ss", orig str, ^ 
dupe str-zreverse(strdup (orig. str))); 
free(dupe str); 
return retval; 


) 


我 们 用 dupe_str 变 量 指向 了 新 申请 的 字符 串 ， 并 依 此 生成 了 要 返回 的 对 象 。 然 后 ， 我 们 调用 
free() 函 数 释放 这 个 字符 串 ， 最 后 返回 到 调用 程序 ， 终 于 完成 了 我 们 要 做 的 事情 。 


为 每 个 模块 增加 一 个 形 如 PyMethodDef ModuleMethods[] 的 数组 。 


ME’ AI] CO AERLON T 8A ELE AA o AUS de PAIRS > MET Python t 3 
能 够 导入 并 调用 它们 。 这 就 是 ModuleMethods[] 数 组 要 做 的 事情 。 


这 个 数组 由 多 个 数组 组 成 。 其 中 的 每 一 个 数组 都 包含 了 一 个 函数 的 信息 。 最 后 放 一 个 NULL 数 
组 表示 列表 的 结束 。 我 们 为 Extest 模 块 创建 一 个 ExtestMethods[] 数 组 : 


static PyMethodDef 

ExtestMethods[] = ( 
( "fac", Extest fac, METH VARARGS ], 
{ "doppel", Extest doppel, METH VARARGS }, 
( NULL, NULL }, 

}; 


每 一 个 数组 都 包含 了 函数 在 Python 中 的 名 字 ， 相 应 的 包装 函数 的 名 字 以 及 一 个 
METH_VARARGS 常 量 。 其 中 ，METH_VARARGS 常 量 表 示 参 数 以 元 组 形式 传 入 。 如 果 我 们 
要 使 用 PyArg_ParseTupleAndKeywords() 函 数 来 分 析 命 名 参数 的 话 ， 我 们 还 需要 让 这 个 标志 
常量 与 METH KEYWORDS 常 量 进行 远 辑 与 运算 常量 。 最 后 ， 用 两 个 NULL 来 结束 我 们 的 函数 
信 息 列 表 

3. 增 加 模块 初始 化 函数 void initModule() 

所 有 工作 的 最 后 一 部 分 就 是 模块 的 初始 化 函数 。 这 部 分 代码 在 模块 导入 的 时 候 被 解释 器 调 
用 。 在 这 段 代 码 中 ， 我 们 需要 调用 Py_lInitModule() 有 函数 ， 并 把 模块 名 和 ModuleMethods[] 数 组 


的 名 字 传 递 进去 ， 以 便 解释 器 能 正确 地 调用 我 们 模块 中 的 函数 。 对 Extest 模 块 来 说 ， 
initExtest() 有 函数 应 该 是 这 个 样子 的 : 


void initExtest() { 
Py InitModule("Extest", ExtestMethods); 
) 
这 样 ， 所 有 的 包装 都 已 经 完成 了 。 我 们 把 以 上 代码 与 之 前 的 Extestl.c 合 并 到 一 个 新 文件 
~Extest2.c 中 。 到 此 为 止 ， 我 们 的 开发 阶段 就 已 经 结束 了 。 
创建 扩展 的 另 一 种 方法 是 先 写 包装 代码 ， 使 用 柱 函 数 、 测 试 函数 或 哑 函 数 。 在 开发 过 程 中 慢 


慢 地 把 这 些 函 数 用 有 实际 功能 的 函数 替换 。 这 样 ， 你 可 以 确保 Python 和 C 之 间 的 接口 函数 是 正 
确 的 ， 并 用 它们 来 测试 你 的 C 代 码 。 


22.2.3 编译 


现在 ， 我 们 已 经 到 了 编译 阶段 。 为 了 让 你 的 新 Python 扩 展 能 被 创建 ， 你 需要 把 它们 与 Python 
库 放 在 一 起 编译 。 现 在 已 经 有 了 一 套 跨 30 多 个 平台 的 规范 ， 它 极 大 地 方便 了 编写 扩展 的 人 。 
distutils 包 被 用 来 编译 、 安 装 和 分 发 这 些 模块 、 扩 展 和 包 。 这 个 模块 在 Python2.0 的 时 候 就 已 经 


出 现 了 ， 并 用 于 代替 1.X 版 本 时 的 用 Makefile 来 编译 扩展 的 方法 。 使 用 distutils 包 的 时 候 我 们 可 
以 方便 地 按 以 下 步骤 来 做 : 

1. 创 建 setup.py ; 

2. 通 过 运行 setup.py 来 编译 和 连接 您 的 代码 ; 

3. 从 Python 中 寻 入 您 的 模块 ; 

4. 测 试 功能 。 

1. 创 建 setup.py 


下 一 步 就 是 要 创建 一 个 setup.py 文 件 。 编 译 最 主要 的 工作 由 setup() 函 数 来 完成 。 在 这 个 函数 调 
用 之 前 的 所 有 代码 ， 都 是 一 些 预 备 动 作 。 为 了 能 编译 扩展 ， 你 要 为 每 一 个 扩展 创建 一 个 
Extension 实 例 ， 在 这 里 ， 我 们 只 有 一 个 扩展 ， 所 以 只 要 创建 一 个 Extension 实 例 : 


Extension('Extest', sources-['Extest2.c']) 


第 一 个 参数 是 (完整 的 ) 扩展 的 名 字 ， 如 果 模 块 是 包 的 一 部 分 的 话 ， 还 要 加 上 用 “.? 分 隔 的 完 
整 的 包 的 名 字 。 我 们 这 里 的 扩展 是 独立 的 ， 所 以 名 字 只 要 写 "Extest' 就 好 了 。Ssources 参 数 是 
所 有 源 代 码 的 文件 列表 。 同 样 ， 我 们 也 只 有 一 个 文件 Extest2.c。 

现在 ， 我 们 可 以 调用 setup() 了 “。Setup() 需 要 两 个 参数 : 一 个 名 字 参 数 表示 要 编译 哪个 东西 ， 
一 个 列表 列 出 要 编译 的 对 象 。 由 于 我 们 要 编译 的 是 一 个 扩展 ， 我 们 把 ext_modules 参 数 的 值 设 
为 扩展 模块 的 列表 。 语 法 如 下 : 


setup('Extest', ext modules-[...]) 


1122.2 

这 个 脚本 会 把 我 们 的 扩展 编译 到 build/lib.* 子 目录 中 。 

1 #!/usr/bin/env python 

2 

3 from distutils.core import setup, Extension 
4 

5MOD = 'Extest' 

6 setup(name-MOD, ext modules-[ 


T Extension(MOD, sources-['Extest2.c'])]) 


由 于 我 们 只 有 一 个 模块 ， 我 们 把 我 们 扩展 模块 对 象 的 实例 化 操作 放 到 了 setup() 的 调用 代码 
中 。 模 块 的 名 字 我 们 就 传 预先 定义 的 “常量 " MOD: 


MOD = 'Extest' 
setup(name-MOD, ext modules-[ 


Extension (MOD,sources-['Extest2.c'])]) 


setup() Zt 3c Zi AK 2 xe v] AE Eo RTA’ REZAYA o dE TAERE RA PEEL] 
È FLE FRE] setup.pyf setup() A ža X 8448 & » (122.226 B T RTA T Pp EA 85 00 3 5 ep 
本 代码 。 


2. 通 过 运行 setup.py 来 编译 和 连接 代码 
现在 ， 我 们 已 经 有 了 setup.py 文 件 。 运 行 setup.py build 命 令 就 可 以 开始 编译 我 们 的 扩展 了 。 


在 我 们 的 Mac 机 上 的 输出 如 下 《使 用 不 同 版 本 的 Python 或 是 不 一 样 的 操作 系统 时 ， 输 出 会 有 
一 些 不 同 ) : 


$ python setup.py build 

running build 

running build ext 

building 'Extest' extension 

creating build 

creating build/temp.macosx-10.x-fat-2.x 


gcc -fno-strict-aliasing -Wno-long-double -no-cpp- 


precomp -mno-fused-madd -fno-common -dynamic -DNDEBUG -g 

-l/usr/include -I/usr/local/include -1/sw/include -I/ usr/local/include/python2.x -=c 
Extest2.c -o build/ temp.macosx-10.x-fat-2.x/Extest2.0 

creating build/lib.macosx-10.x-fat-2.x 

gcc -g -bundle -undefined dynamic lookup -L/usr/lib -L/ usr/local/lib -L/sw/lib 
-I/usr/include -I/usr/local/ include -I/sw/include build/temp.macosx-10.x-fat-2.x/ 
Extest2.0 -o build/lib.macosx-10.x-fat-2.x/Extest.so 


22.2. 导入 和 测试 
1. 从 Python 中 导入 您 的 模块 


你 的 扩展 会 被 创建 在 你 运行 Setup.py 脚 本 所 在 目录 下 的 build/lib.* 目 录 中 。 你 可 以 切换 到 那个 目 
录 中 来 测试 你 的 模块 ， 或 者 也 可 以 用 以 下 命令 把 它 安装 到 你 的 Python 中 。 


$ python setup.py install 


如 果 安 装 成 功 ， 你 会 看 到 : 
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running install 
running build 
running build ext 
running install lib 
copying build/lib.macosx-10.x-fat-2.x/Extest.so -> 
/usr/local/lib/python2.x/site-packages 

现在 ， 我 们 可 以 在 解释 器 里 测试 我 们 的 模块 了 : 

>>> import Extest 

>>> Extest.fac(5) 

120 

>>> Extest.fac(9) 

362880 

>>> Extest.doppel('abcdefgh') 

('abcdefgh', 'hgfedcba') 

>>> Extest.doppel("Madam, I'm Adam.") 


("Madam, I'm Adam.", ".madA m'I ,madaM") 


2. 测 试 功 能 


我 们 想 要 做 的 最 后 一 件 事 就 是 加 上 一 个 测试 函数 。 事 实 上 ， 我 们 已 经 写 好 一 个 了 ， 就 是 main() 
函数 。 现 在 ， 在 我 们 代码 中 放 一 个 main() 有 函数 是 一 件 比 较 危 险 的 事 ， 因 为 一 个 系统 中 只 能 有 一 
Amain) ik » £&fi1demain() i ZX PC X test() > Z» 4 Extest test() 函 数 把 它 包 装 起 来 ， 然 后 在 
ExtestMethods 中 加 入 这 个 函数 就 不 会 有 这 样 的 问题 了 。 代 码 如 下 : 
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static PyObject * 

Extest test(PyObject *self, PyObject *args) ( 
test (); 
return (PyObject*)Py BuildValue(""); 

) 

static PyMethodDef 

ExtestMethods[] = ( 

( "fac", Extest fac, METH VARARGS ], 


( "doppel", Extest doppel, METH VARARGS ], 
( "test", Extest test, METH VARARGS ], 
( NULL, NULL }, 

} ; 


Extest_test() 模 块 函 数 只 负责 运行 test() 有 函数 ， 并 返回 一 个 空 字符 串 。Python 的 None 作 为 返回 
值 ， 传 给 了 调用 者 。 现 在 ， 我 们 可 以 在 Python 中 调用 同样 的 test() 函 数 了 : 


>>> Extest.test() 


4! == 24 
8! == 40320 
12! == 479001600 


reversing 'abcdef', we get 'fedcba' 
reversing 'madam', we get 'madam' 
>>> 
在 例 22.3 中 ， 我 们 给 出 了 Extest2.c 的 最 终 版 本 。 这 个 版 本 会 输出 我 们 刚才 所 看 到 的 结果 。 
在 本 例 中 ， 我 们 把 我 们 的 C 代 码 和 Python 相关 的 代码 分 开放 ， 一 段 在 上 面 ， 一 段 在 下 面 。 


这 样 可 以 让 代码 更 具 可 读 性 。 对 于 小 程序 来 说 ， 没 有 任何 问题 。 但 在 实际 应 用 中 ， 源 代码 会 
越 写 越 大 。 一 部 分 人 就 会 考虑 把 他 们 的 包装 函数 放 在 另 一 个 源 文件 中 。 起 个 诸如 
ExtestWrappers.c 之 类 好 记 的 名 字 。 


22.2.5 引用 计数 


AS 00)-- l7 E 4 no 
322% V /KPython 930 


也 许 你 还 记得 ，Python 使 用 引用 计数 作为 跟踪 一 个 对 象 是 否 不 再 被 使 用 ， 所 占 内 存 是 否 应 该 
被 回收 的 手段 。 它 是 垃圾 回收 机 制 的 一 部 分 。 当 创建 扩展 时 ， 你 必需 对 如 何 操作 Python 对 象 
格外 小 心 。 你 时 时 刻 刻 都 要 注意 是 否 要 改变 茶 个 对 象 的 引用 计数 。 


一 个 对 象 可 能 有 两 类 引用 。 一 种 是 拥有 引用 ， E Ead ， 以 表示 你 也 拥 
有 这 个 对 象 的 所 有 权 。 如 果 这 个 Python 对 象 是 你 自己 创建 的 ， 那 么 这 时 你 肯定 拥有 这 个 对 象 
的 所 有 权 。 


当 你 不 再 需要 一 个 Python 对 象 时 ， 你 必须 要 交 出 你 的 所 有 权 ， 要 么 把 引用 计数 减 1， 要么 把 所 
有 权 交 给 别人 人， 要么 就 把 这 个 对 象 存 到 其 他 的 容器 中 (元 组 、 列 表 等 ) 。 没 有 交 出 所 有 权 就 
会 导致 内 存 泄 漏 。 


你 也 可 以 拥有 对 象 的 借 引用 。 相 对 来 说 ， 这 种 方式 的 责任 就 小 一 些 。 除 非 是 别人 在 外 面 把 对 
象 传递 给 你 。 否 则 ， 不 要 用 任何 方式 修改 对 象 里 的 数据 。 你 也 不 用 时 刻 考 虑 对 象 引用 计数 的 
问题 ， 只 要 你 不 会 在 对 象 的 引用 计数 减 为 0 之 后 再 去 使 用 这 个 对 象 。 你 也 可 以 把 借 引 用 对 象 用 
的 数量 加 1， 从 而 趴 正 地 引用 这 个 对 象 。 


例 22.3 C 库 的 Python 包装 版 本 (Extest2. c) 


1 .#include<stdio.h> 

2 #include<stdlib.h> 

E #include<string.h> 

4 

5 int fac(int n) 

6 { 

7 if (n € 2) zeturxntl); 
8 return (n) *fac (n-1) ; 
9 ) 

10 


EL char *reverse(char *s) 


12 ( 
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13 register char t, 

14 *p * s, 

15 *q = (s + (strzlen(s) - 1); 
16 

17 while (s && ip < q)) 

18 { 

19 t = *p; 

20 *pe** = *q; 

21 fg. £4 

22 } 

23 return s; 

24 | 

25 

26 int testi) 

2T ( 

28 char s[8UFSI2]; 

23 printf("4! == d\n", fac(4]): 

30 printf("B! == &dMn", fac(8)): 

31 printf(^12! == d\n", fac(1i2)); 

32 strcpy(s, "abcdef"); 

33 printf("reversing 'abcdef', we get '*s'*n", ^ 
34 reverseis)); 

35 strcpy(s, "madam"); 

36 printf("reversing 'madam', we get 'is'Win", V 
37 reverse(s)); 

38 return 0; 

39 | 

40 

41 include "Python.h" 

42 


43 static PyObject * 
44  Extest fac(PyObject *self, PyObject *args) 


45 | 

46 int num; 

47 if (!PyArg ParseTuple(args, "i", &num)) 

48 return NULL; 

49 return (PyObject*)Py BuíldValue("i", fac(num));! 
50 | 

51 


52 static PyObject * 
53  Extest doppel(PyObject *self, PyObject *args) 


54 | 

55 char *orig str: 

56 Char *dupe str; 

57 PyObject* retval; 

58 

59 if (!PyArg ParseTuple(args, "s", &orig str)) 

60 return NULL; 

6l retval = (PyObject*)Py BuildValue("ss", orig str, \ 
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62 dupe str-zreverse(strdup(orig str))); 
63 free (dupe str); 

64 return retval; 

65 1 

66 


67 static PyObject * 
68  Extest test(PyObject *self, PyObject *args) 


69 ( 

70 test(); 

11 return (PyObject*)Py BuildValue (""); 
AG u 

3 


74 static PyMethodDef 
785 ExtestMethods[] = 


T& 4 

E ( "fac", Extest fac, METH VARARGS ), 

78 { "doppel", Extest doppel, METH VARARGS }, 
79 ( "test", Extest test, METH VARARGS }, 
80 ( NULL, NULL }, 

81 J} 

82 

83 void initExtest() 

84 í 

85 Py InitModule("Extest", ExtestMethods); 
86 ) 


Python 提供 了 一 对 C 的 宏 ， 可 以 用 来 改变 Python 对 象 的 引用 计数 ， 见 表 22.3. 
m 22.3 执行 Python 对 象 引 用 计数 的 宏 


增加 对 象 obj 的 引用 计数 


Py DECREF(ob/) KPL ob 的 引用 计数 





在 上 面 的 Extest test() 函 数 中 ， 我 们 创建 了 一 个 空 字符 串 的 PyObject 对 象 ， 用 以 返回 None。 
或 者 ， 你 也 可 以 对 空 对 象 【PyNone) 的 引用 计数 加 1， 成 为 PyNone 的 拥有 者 ， 然 后 直接 返回 
PyNone， 见 下 例 。 
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static PyObject * 

Extest test(PyObject *self, PyObject *args) í( 
test(); 
Py INCREF (Py None) ; 


return PyNone; 


Py INCREF()fePy DECREF()/& 4- £ Zt 4p — 4 bd So $E EVI mM 
Py XINCREF()fePy XDECREFO ° 


我 们 强烈 建议 读者 阅读 Python 文 档 的 扩展 和 嵌入 Python 部 分 中 的 关于 引用 计数 的 内 容 ( 见 附 
录 中 的 文档 参考 部 分 ) 。 


22.2.6 ”线程 和 全 局 解释 器 锁 (GIL) 


编译 扩展 的 人 必须 要 注意 ， 他 们 的 代码 有 可 能 会 被 运行 在 一 个 多 线程 的 Python 环境 中 。 早 在 
18.3.1 节 ， 我 们 就 介绍 了 Python 虚拟 机 (PVM) 和 全 局 解释 器 锁 (GIL) ， 并 描述 了 在 PVM 

中 ， 任 何 情况 下 同时 只 会 有 一 个 线程 被 运行 ， 其 他 线程 会 被 GIL 停 下 来 。 而 有 全， 我 们 指出 调用 
扩展 代码 等 外 部 函数 时 ， 代 码 会 被 GIL 锁 住 ， 直 到 函数 返回 为 止 。 


o 过 一 种 折衷 方案 ， 可 以 让 纺 Ri REGE 员 释 放 GIL， 例 如 在 系统 调用 前 就 可 

以 做 到 。 过 将 你 的 代码 和 线程 隔离 实现 的 ， 这 些 线程 使 用 了 另外 两 个 C 宏 

PyBEGIN _ Wen Mei Med > 保证 了 运行 和 非 运行 时 的 安 
全 性 。 由 这 些 宏 包 庄 的 代码 将 会 允许 其 他 线程 的 运行 


同 引 用 计数 宏一 样 ， 我 们 强烈 建议 阅读 关于 扩展 和 诅 入 Python 的 文档 和 Python/C API 参 考 手 
A o 


22.3 相关 话题 


1. SWIG 


有 一 个 外 部 工具 叫 SWIG， 是 Simplified Wrapper and Interface Generator 的 缩写 。 其 作者 为 
大 卫 。 比 兹 利 (David Beazley) ， 同 时 也 是 《Python Essential Referenc》 一 书 的 作者 。 这 个 
工具 可 以 根据 特别 注释 过 的 C/C++ 头 文件 生成 能 给 Python、Tel 和 Perl 使 用 的 包装 代码 。 使 用 
SWIG 可 以 省 去 你 写 前 面 所 说 的 样板 代码 的 时 间 ， 你 只 要 关心 怎么 用 C/C++ 解 决 你 的 实际 问题 
就 好 了 。 你 所 要 做 的 就 是 按 SWIG 的 格式 编写 文件 ， 其 余 的 ie 由 SWIG 来 完成 。 你 可 以 通过 
下 面 的 网 址 找到 关于 SWIG 的 更 多 信息 。 


http://swig.org 


2. Pyrex 


创建 CI/C++ 扩 展 的 一 个 很 明显 的 缺点 是 你 必须 要 写 C/C++ 代 码 。 你 能 利用 它们 的 优点 ， 
要 的 是 ， 你 也 会 碰 到 它们 的 缺点 。Pyrex 可 以 让 你 只 取 扩 展 的 优点 ， 而 完全 没有 后 顾 之 忧 。 
是 一 种 更 偏向 Python 的 C 语 言 和 Python 语言 的 混合 语言 。 事 实 上 ，Pyrex 的 官方 网 站 上 就 
说 "Pyrex 是 具有 C 数 据 类 型 的 Python“。 你 只 要 用 Pyrex 的 语法 写 代 码 ， 然 后 运行 Pyrex 编 译 器 
去 编译 源 代码 。Pyrex 会 生成 相应 的 C 代 码 ， 这 些 代码 可 以 被 编译 成 普通 的 扩展 。 你 可 以 在 它 
的 官方 网 站 下 载 到 Pyrex: 


http://cosc.canterbury.ac.nz/~greg/python/Pyrex 


3. Psyco 


Pyrex 免 去 了 我 们 再 去 写 纯 C 代 码 的 麻烦 。 不 过 ， 你 要 去 学 会 它 的 那 一 套 与 众 不 同 的 语法 。 最 
后 ， 你 的 Pyrex 代 码 还 是 会 被 转 成 C 的 代码 。 无 论 你 用 C/C++、C/C++ 加 上 SWIG， 或 者 是 
Pyrex， 都 是 因为 你 想 要 加 快 你 的 程序 的 速度 。 如 果 你 可 以 在 不 改动 你 的 Python 代码 的 同时 ， 
又 能 获得 速度 的 提升 ， 那 该 多 好 啊 。 


Psyco 的 理念 与 其 他 的 方法 截然 不 同 。 与 其 改 成 C 的 代码 ， 为 何不 让 你 已 有 的 Python 代码 运行 
的 更 快 一 些 呢 ? 


p eo MR (JIT) 编译 器 ， 它 能 在 运行 时 自动 把 字 节 码 转 为 本 地 代码 运行 。 所 
， 你 只 要 (在 运行 时 ) 导入 Psyco 模 块 ， 然 后 告诉 它 要 开始 优化 代码 就 可 以 了 ， 而 不 用 修改 
自己 的 代码 。 


Psyco 也 可 以 检查 你 代码 各 个 部 分 的 运行 时 间 ， 以 找 出 瓶颈 所 在 。 你 甚至 可 以 打开 日 志 功 能 ， 
来 查看 Psyco 在 优化 你 的 代码 的 时 候 都 做 了 些 什 么 。 你 可 以 访问 以 下 网 站 获取 更 多 的 信息 : 


http://psyco.sf.net 
4.3 AX 


seu iud 8j A— HAE » £j dec 6X SI Python T $947 /&d8 d 6) » dt A t de Python AE 
器 包装 到 C 的 程序 中 。 这 样 做 可 以 给 大 型 的 、 单 一 的 、 要 求 严格 的 、 私 有 的 并 且 (或 者 ) 极其 
$495 HE Python AE 35 838677 » — 9. A ik 1 Python » SX A4 T ° 


Python 提供 了 很 多 官方 文档 供 写 扩展 的 人 参考 。 
下 面 是 一 些 与 本 章 相 关 的 Python 文档 : 
TRAIRA 

http://docs.python.org/ext 
Python/C API 

http://docs.python.org/api 


分 发 Python 模块 


Python 核心 编程 第 二 版 


http://docs.python.org/dist 


22.4 练习 


22-1. 扩 展 Python。 编 写 Python 扩 展 有 什么 好 处 ? 
22-2. 扩 展 Python。 编 写 Python 扩 展 有 什么 不 好 或 是 危险 的 地 方 ? 


22-3. 编 写 扩 展 。 下 载 或 找到 一 个 C/C++ 编译 器 ， 并 写 一 个 小 程序 (重新 ) 熟悉 一 下 
C/C++ 编程 。 找 到 你 的 Python 所 在 的 目录 ， 并 找到 Misc/Makefile.pre.in 文 件 。 把 你 刚 写 
的 程序 包装 到 Python 当中 。 按 步骤 把 你 的 模块 编译 成 动态 库 ， 从 Python 中 调用 你 的 模块 
并 测试 一 下 是 否 正确 。 


22-4. 把 Python 移植 到 C。 选 几 个 你 在 前 几 章 写 的 代码 ， 并 把 它们 作为 模块 移植 到 
C/C++ 中 。 


22-5. 包 装 C 代 码 。 找 一 段 你 之 前 写 的 ， 想 移植 到 Python 的 C/C++ 代码 。 不 要 去 移植 ， 把 
这 段 代码 改 成 扩展 模块 。 


22-6. 编 写 扩展 。 在 13-3 的 练习 中 ， Www quide 
元 符号 ， 过 号 分 隔 的 货币 金额 字符 串 。 请 创建 一 个 扩展 ， 和 包装 dollarize() 子 数 ， ben 
中 增加 一 个 回归 测试 函数 test()。 附 加 题 : 除了 创 ep > 再 用 Pyrex 重 写 dollarize() 
TE 


22-7 A. JÉ de de X o PRERA EAE? 
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第 23 章 ”其 他 话题 


4 引言 
+ Web 服 务 
+ 用 Win32 的 COM 来 操作 Microsoft Office 


+ 用 Jython 写 Python 和 Java 的 程序 


4 练习 
a eg 一 下 有 关 Python 编 程 的 一 些 杂 项 ， 很 可 异 ee 
探讨 这 些 主题 。 希 望 在 本 书 的 下 一 版 中 ， 将 每 个 相关 主题 单列 一 章 。 


23.1 Web 服 务 


在 网 络 上 ， 有 大 量 的 Web 服 务 和 应 用 ， 它 们 提供 各 式 各 样 的 服务 。 您 会 发 现 多 数 大 型 服务 商 
都 会 提供 (其 服务 的 ) 应 用 程序 接口 (API) > Kid» Yahoo! 、Google、eBay 和 Amazon 等 。 

过 去 API 仅 仅 被 用 来 访问 使 用 这 些 服 务 的 数据 ， 但 是 今天 的 API 已 经 不 同 ， 它 们 不 但 丰富 而 且 
功能 齐全 ， 而 且 您 可 以 将 这 些 Web 服 务 整 合 到 您 自己 的 个 人 网 站 和 网 页 中 ， 这 通常 被 称 
1E*Mash-ups" [1] 


这 是 一 些 很 有 意思 的 功能 ， 但 是 ， 暂 时 我 们 只 简单 的 尝试 一 个 很 有 用 ， 同 时 提供 时 间 也 比较 
长 的 服务 ， 即 Yahoo ! 提供 的 股票 报价 服务 。 其 网 址 是 http://finance.yahoo.com. 


Yahoo ! 金融 股票 报价 服务 [2] 


如 果 访 问 下 面 的 网 站 查询 某 支 股票 的 价格 ， 就 会 在 标 了 “DownloadData”" 的 基本 报价 那里 看 到 
一 个 连接 。 这 个 连接 允许 你 下 载 一 个 可 以 导入 Microsoft Excel 和 |ntuit Quicken 的 CSV 格 式 文 
件 。 


http://finance.yahoo.com/d/ 
quotes.csv?s- GOOGG&f-sl 1 dl ti c 1 ohgv&e-. esv 


如 果 浏 览 器 的 MIME 设 置 正 确 的 话 ， 你 的 浏览 器 将 启动 Excel 打 开 下 载 好 的 文件 。 这 主要 是 因 
为 连接 中 包含 了 e=Xxsv 的 设置 。 这 样 的 设置 将 使 server 返 回 CSV 格 式 的 结果 


如 果 我 们 使 用 urllib.urlopen() 来 得 到 报价 ， 会 得 到 一 行 CSV 格 式 的 返回 结果 : 


>>> from urllib import urlopen 

>>> u = urlopen('http://quote.yahoo.com/d/ 
quotes.csv?ssYHOO&fsslldltlclohgv') 

>>> for row in u: 


print 'row' 


""YTHOO", 30. 76,"5J7423/ 
2006","4:00pm", +0.30, 31.07, 31.63, 30.76, 28594020 XrMn' 


您 可 以 手工 解析 这 个 返回 的 字符 囊 (去 掉头 尾 的 空白 字符 ， 根 据 运 号 进行 分 割 ) ， 或 者 也 可 
以 使 用 Python2. 3 版 本 新 加 入 的 csv 模 块 。 这 个 模块 自动 完成 字符 串 分 割 和 去 掉头 尾 空白 字符 
的 功能 。 使 用 csv 的 话 ， 我 们 就 可 以 其 他 的 代码 不 变 ， 把 上 面 的 那个 for 循 环 改 为 : 


W 


>>> import csv 
>>> for row in csv.reader (u): 


print row 


['YHOO', '30.76', '5/23/2006', '4:00pm', "+030" 
U1.07', "35,53, '3D.T6', "2825940290^] 


分 析 传 递 给 server 的 {f 参 数 并 看 了 Yahoo ! 的 这 个 服务 的 在 线 帮 助 后 ， d 符号 
slldltlclohgv 对 应 着 : 订单 号 、 最 后 的 价格 、 日 期 、 时 间 、 交 化 量 、 开 盘 价 、 当 日 最 高 
最 低 和 成 交 量 。 


您 可 以 通过 访问 Yahool Finance 帮 助 页 面 获得 更 多 的 信息 
data” 或 “download spreadsheet format" 就 可 以 了 。 


只 要 搜索 “download 





深入 的 分 析 这 个 API， 我 们 可 以 得 到 更 多 的 信息 ， 如 : 上 一 次 收盘 价 ，52 周 内 的 最 高 和 最 低 价 
等 。 总 而 言 之 ， 表 23.1 列 出 了 返回 数据 的 格式 。 


每 一 段 的 名 字 按 你 想 要 的 数据 的 顺序 排列 。 只 要 把 它们 连接 在 一 起 整个 作为 参数 f， 加 到 请 求 
URL 中 。 
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5 23.1 Yahoo! Finance 股票 报价 服务 器 参数 
mon crt Field Name* Format Retumed" 
Stock ticker symbol s "YHOO" 
Price of last trade ll | 328 
Last trade date di 2/2/2000 
Time of last trade 让 "4:00pm" 
Change from previous close el | *10.625 
pamm p2 "3.35%" 
previous close 
Previous closing price p 317.375 
Last opening price o 321.484375 
Daily high price 37 
Beam. | | hs 
Volume for the day 6703300 
Eamings per share 020 
Gee S | —— ome 


3. 字段 名 的 第 一 个 字符 是 一 个 字母 ， 
b， 有 一 些 值 且 用 双 引 号 括 起 来 的 ， 


有 些 返 回 结果 是 用 引号 括 起 来 的 。 解 析 代码 要 能 正确 地 解析 这 些 数据 。 观 察 上 面 手工 解析 
回 字 符 串 和 用 CSV 模 块 解析 返回 字符 串 所 得 到 的 结果 。 如 果 某 个 值 不 存在 报价 ， 服 务 器 会 


回 "N/A”。 


第 二 个 字符 (如果 有 的 话 ) 是 数字 。 


iR 
iR 


例如 ， 如 果 我 们 给 服务 器 的 f 字 段 为 全 slldlclp2， 我 们 会 得 到 如 下 的 字符 串 : 


"YHOO",166.203125, "2/23/2000",412.390625,"48.06$" 


如 果 是 不 公开 交易 的 股票 ， 我 们 会 得 到 如 下 的 结果 (注意 ， 不 少 列 都 是 双 引 号 引起 来 的 ， 包 


括 N/A): 


"PBLS.OB",0.00,"N/A",N/A, "N/A" 


报价 服务 器 也 支持 同时 指定 多 支 股票 ， 如 S=YHOO,GOOQEBAYAMZN 。 返 回 的 结果 是 每 支 

股票 信息 占 一 行 。 要 记 住 Yahool Finance 帮 助 页 面 所 说 的 : 任何 把 Yahoo ! 显示 的 数据 再 次 发 
布 的 行为 都 是 严格 禁止 的 。 所 以 ， 你 只 能 把 这 些 信息 用 于 私人 用 途 。 同 时 也 要 记 住 ， 所 有 你 

得 到 的 数据 ， 都 是 有 一 定 延 时 的 。 用 我 们 已 有 的 知识 ， 我 们 可 以 实现 一 个 应 用 程序 ( 例 


23.1) ， 用 于 读 取 并 显示 一 些 我 们 关心 的 互连网 公司 的 股票 报价 信息 。 
例 23.1 Yahoo! Finance 股 票 报价 示例 (stock.py) 


这 个 脚本 能 从 Yahoo ! 报价 服务 器 下 载 并 显示 股票 的 价格 。 
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1 t! /usr/bin/env python 


3 from time import ctime 

4 from urllib import urlopen 

5 

6 ticks - ('YHOO', 'GOOG', 'EBAY', 'AMZN') 

7 URL = 'http://quote.yahoo.com/d/quotes.csv?sess&áfesllclp2' 

8 

9 print 'MnPrices quoted as of:', ctime() 

10 print 'MnTICKER'.ljust(9), 'PRICE'.1just(8), 'CHG'.1just(5), '$AGE' 
11 print '------ !',1just(8), '----- *,1just(8), "' )51,1jdüst(5), "=-=! 
12 u = urlopen(URL $ ','.join(ticks)) 

13 

14 for row in u: 

15 tick, price, chg, per = row.split(',') 

16 print eval(tick).1just(7), \ 

17 ('$.2f' 4 round(float(price), 2)).rjust(6), \ 

18 chg.rjust(6), eval(per.rstrip()).rjust(6) 

19 


20 f.close() 


如 果 我 们 执行 这 个 脚本 ， 会 得 到 如 下 的 输出 : 


$ stock.py 

Prices quoted as of: Sat May 27 03:25:56 2006 
TICKER PRICE CHG SAGE 

YHOO 33.02 +0.10 +0.30% 

GOOG 381.35 -1.64 -0.43$ 

EBAY 34.20 *0.32 +0.94% 

AMZN 36.07 +0.44 +1.23% 


23.2 用 Win32 的 COM 来 操作 微软 Office 


在 你 日 常 工作 环境 中 所 能 做 的 最 有 用 的 事情 之 一 就 是 集成 对 Win32 程 序 的 支持 。 实 现 从 这 样 的 
应 用 程序 中 读 写 数据 是 很 容易 的 事 。 虽 然 你 所 在 的 部 门 可 能 用 不 着 Win32 环 境 ， 但 很 有 可 能 你 
的 经 理 或 是 其 他 的 工程 组 在 用 。Mark Hammond 的 Python 的 Windows 扩 展 使 得 程序 员 可 以 在 
本 地 环境 直接 与 Win32 程 序 进 行 交 互 。 


N 
CD 
\ 
C 
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Win32 编 程 是 一 个 相当 广泛 的 概念 。Python 的 Windows 扩 展 包 包含 了 其 中 的 大 部 分 。 如 : 
Windows API、 进 程 、Microsoft Foundation Classes (MFC) 图 形 界面 接口 (GUI) 开发 、 
Windows 多 线程 开发 、 服 务 、 远 程 访 问 、 管 道 、COM 服 务 端 编程 和 事件 。 还 有 一 个 能 在 。 
NET/Mono 开 发 环境 中 使 用 的 Python 语言 的 C# 实 现 : IronPython。 在 本 节 ， 我 们 主要 关注 
Win32 程 序 设计 的 一 部 分 一 一 客户 端 COM 编 程 ， 它 有 着 相当 广泛 的 实际 用 途 。 


23.2.1 客户 端 COM 编 程 


我 们 可 以 使 用 组 件 对 象 模型 ， 另 一 个 比较 熟悉 的 名 字 是 COM (市 场 化 的 名 字 是 ActiveX) 来 与 
诸如 Outlook 和 Excel 之 类 的 工具 进行 通讯 。 对 于 程序 员 来 说 ， 能 在 Python 代码 中 直接 “控制 "一 
个 本 地 Office 应 用 程序 是 一 件 很 快乐 的 事情 。 


特别 地 ， 当 说 到 使 用 一 个 COM 对 象 时 ， 即 启动 一 个 应 用 程序 ， 并 允许 代码 访问 该 应 用 程序 提 
供 的 方法 ， 被 称 为 客户 端的 COM 编 程 。 实 现 一 个 COM 对 象 供 其 他 客户 端 调用 则 被 称 为 服务 端 
的 COM 编 程 。 


核心 笔记 : Python 与 微软 COM (客户 端 ) 编程 


在 Windows 32 位 平台 上 ，Python 与 COM 是 可 以 相互 操作 的 。COM 是 微软 的 一 种 接口 技术 ， 
它 定义 了 语言 及 格式 无 关 的 对 象 与 对 象 之 间或 是 更 高 层次 的 应 用 程序 与 应 用 程序 之 间 的 通 
讯 。 本 节 中 ， 我 们 将 看 到 如 何 把 Python 与 COM (客户 端 编 程 ) 组 合 起 来 ， 与 微软 Office 的 应 
A & $- 4» Word ` Excel ` PowerPoint£e Outlook. I5] 3t £7 38 7, o 


本 节 的 先决 条 件 是 要 运行 在 Win32 平 台 上 ， 并 且 安 装 了 Python 和 Python 的 Windows 扩 展 。 同 
时 ， 必 需要 安装 一 个 或 多 个 例子 中 用 到 的 微软 应 用 程序 。Python 的 Windows 扩 展 的 下 载 说 明 
很 容易 看 懂 ， 照 着 做 一 般 不 会 出 问题 。 我 们 推荐 用 扩展 自 带 的 PythonWin 作 为 创建 和 测试 你 
Win32 脚 本 的 IDE ° 


在 本 节 中 ， 我 们 将 演示 如 何 与 Office 应 用 程序 进行 交互 。 我 们 将 给 出 几 个 示例 ， 并 详细 解释 它 
们 。 其 中 有 一 些 例 子 是 非常 实用 的 。 你 也 能 在 “Python Cookbook" 网 站 找到 一 部 分 例子 。 必 须 
承认 的 是 ， 我 们 并 不 是 COM 或 是 Visual Basic 的 专家 同时 ， 我 们 也 知道 ， 这 些 例 子 还 有 很 大 的 
可 以 改进 的 空间 。 我 们 强烈 希望 所 有 读者 把 您 认为 对 大 家 有 用 的 评论 、 建 议 或 改进 发 给 我 
们 。 


我 们 先 从 很 简单 的 微软 Excel、Word、PowerPoint、Outlook 的 启动 和 交互 开始 。 在 展示 例子 
之 前 ， 我 们 要 先 指出 ， 客 户 端 COM 应 用 程序 运行 时 都 遵循 相同 的 几 个 步骤 。 与 这 些 应 用 程序 
进行 交互 的 典型 的 方法 是 这 样 的 : 


1. 启 动 应 用 程序 ; 


2. 打 开 要 编辑 的 文档 ; 


3. 显 示 应 用 程序 (如 果 有 必要 的 话 ) ; 
4. 对 文档 做 一 定 的 操作 ; 

5. 保 存 或 放弃 文档 ; 

6. 退 出 。 


说 的 够 多 了 ， 下 面 开 始 看 一 些 代 码 吧 。 以 下 是 一 系列 脚本 ， 用 于 控制 不 同 的 微软 的 应 用 程 
序 。 这 些 脚 本 都 导入 了 win32com.client 模 块 和 一 些 Tk 模 块 来 控制 各 个 应 用 程序 的 启动 (和 其 
他 操作 ) 。 同 第 19 音 一样， 我 们 采用 。pyw 后 组 来 避免 不 必要 的 DOS 命 令 窗口 。 


23.2.2 ”微软 Excel 


我 们 的 第 一 个 例子 演示 如 何 使 用 EXxcel。 在 整个 Office 系 列 软件 中 ， 我 们 发 现 Excel 是 最 可 编程 
的 。 用 Excel 处 理 数据 非常 的 有 用 ， 一 方面 可 以 利用 电子 表格 的 功能 优势 ， 另 一 方面 可 以 用 非 
常 好 的 打印 格式 来 查看 数据 。 而 且 可 以 从 电子 表格 中 读 取 数据 ， 然 后 使 用 像 Python 这 样 的 编 
程 语 言 来 处 理 数 据 ， 这 一 点 也 非常 有 用 。 在 这 一 部 分 的 最 后 我 们 会 给 出 一 个 使 用 Excel 的 更 加 
复杂 一 点 的 例子 ， 但 是 我 们 总 得 开始 吧 ， 所 以 我 们 先 从 例 23.2 开 始 。 


例 23.2 “Excel 例子 (excel.pyw) 


这 个 脚本 启动 Excel， 然 后 将 数据 填 到 电子 表格 的 空格 中 。 


$!/usr/bin/env python 


from Tkinter import Tk 


from time import sleep 
import win32com.client as win32 


1 

2 

3 

E 

5 from tkMessageBox import showwarning 

6 

z 

8 warn = lambda app: showwarning(app, 'Exit?') 
9 


RANGE = range(3, 8) 


10 
11 def excel (): 


12 app = 'Excel' 

13 xl win32.gencache.EnsureDispatch('$s.Application' * app) 
14 ss = xl.Workbooks.Add() 

15 sh = ss.ActiveSheet 

16 xl.Visible * True 

17 sleep(1) 

18 

19 sh.Cells(1,1).Value = 'Python-to-*s Demo' * app 

20 sleep(1) 


for i in RANGE: 


sh.Cells(i,l).Value = 'Line $d' $ 


23 sleep(1) 

24 sh.Cells(i*2,1).Value = "Th-th-tn-that's all folks!" 
PoS 

26 warn (app) 

27 ss.Close(False) 

28 xl.Application.Quit() 

29 


30 if name VU main Te 


31 TkK() .withdraw() 
32 excel() 
逐 行 解 释 


1~6、31 行 


我 们 导入 Tkinter 和 tkMessageBox 模 块 只 是 为 了 使 用 showwaming 消 息 框 来 终止 演示 。 在 显示 
对 话 框 (26 行 ) 之 前 ， 我 们 调用 withdraw() 函 数 先 绘 出 Tk 最 顶层 的 窗口 (31 行 ) 。 如 果 你 不 
首先 初始 化 顶层 窗口 ， 系 统 会 自动 地 为 你 创建 一 个 ， 不 过 ， 自 动 创建 的 不 会 自动 关闭 ， 而 会 
很 讨厌 地 显示 在 屏幕 上 。 


11 ~ 17 行 


当代 码 启 动 (或 调用 ) Excel 后 ， 我 们 添加 了 一 个 工作 簿 (就 是 包含 了 多 个 可 以 写 数 据 的 工作 
表 的 电子 表格 ) 。 并 得 到 了 正在 显示 的 活动 表格 的 句柄 。 不 要 在 术语 上 花 太 多 精力 ， 因 为 " 工 
作 薄 包含 好 几 个 工作 表 " 这 种 话 很 容易 使 人 迷惑 。 


核心 笔记 : 静态 和 动态 调用 


ii BRL NR UN MD 这 个 脚本 之 前 ， 我 们 从 PythonWin 中 运行 Makepy 
具 《 居 动 IDE， 选 择 Tools-->COM Makepy 工 具 ， 然 后 选择 相应 的 应 o ， 这 个 工具 
ny 没有 这 些 预先 准备 工作 ， 对 象 和 属性 得 在 运行 时 建立 。 如 
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果 是 在 运行 时 创建 对 象 和 属性 ， 那 么 就 叫做 动态 调用 。 如 果 您 想 动态 运行 ， 那 么 请 使 用 常用 
的 Dispatch() 函 数 。 


xl = win32com. client. Dispatch ('96s. Application'% app) 


Visible 标 记 必 须 设 为 True， 这 样 才 可 以 让 应 用 程序 显示 在 桌面 上 ， 然 后 停 下 来 ， 这 样 用 户 可 
以 看 到 演示 的 每 一 步 (4716) 。 要 知道 第 17 行 sleep() 调 用 的 含义 ， 请 阅读 接 下 来 的 内 容 。 


19 ~ 24 行 


在 这 个 脚本 程序 的 应 用 部 分 (application portion) ， 我 们 把 这 个 演示 的 标题 写 到 了 左上 角 的 

第 一 格 ， 也 就 是 (Al) (1,1) ， 然 后 跳 过 了 一 行 ， 把 "Line N? 写 到 相应 的 格 中 ，N 是 从 3 到 

7 的 数字 。 在 写 时 候 中 间 停 顿 1 秒 ， 这 样 您 就 可 以 看 到 演示 过 程 了 (如果 没有 延迟 ， 
写 每 一 行 的 过 程 会 非常 快 ) 。 


26 ~ 32 行 


在 演示 结束 的 时 候 ， 会 弹出 一 个 消息 对 话 框 ， 以 方便 用 户 在 看 完 输出 后 ， 结 束 演 示 程 序 。 电 
子 表格 关闭 时 不 会 被 保存 ， 首 先 调用 ss. Close ([SaveChanges-]False) ， 然 后 应 用 程序 结 
束 。 最 后 ， 脚 本 的 “main” 部 分 只 是 初始 化 Tk， 然 后 执行 应 用 程序 的 核心 部 分 。 运 行 这 个 脚本 
程序 ， 会 弹出 一 个 Excel 应 用 程序 窗口 ， 如 图 23-1 所 示 。 


i E Microsoft mI Bookl 


Python-to--xcel Demo 


Line3 — 
Line 4 
Line 5 
lg s M NAMEN IMEEM 
Line 7 / 





Th-th-th-that's all folks! — 





图 23-1 Python-to-Excel 示 例 脚 本 (excel.pyw ) 


第 23 章 ”其 他 话题 944 
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23.2.3 微软 Word 


下 面 来 演示 一 下 如 何 使 用 Word。 由 于 涉及 到 的 数据 不 多 ， 用 Word 写 文档 的 可 编程 性 就 不 是 那 
么 强 了 。 你 可 以 考虑 用 VWord 来 自动 生成 格式 化 的 信件 等 。 不 过 ， 在 例 23. 3 中 ， 我 们 将 创建 一 
个 文档 ， 然 后 简单 地 写 几 行 字 。 


例 23.3 


Word 例 子 (word.pyw ) 


这 个 脚本 启动 Word， 然 后 向 文档 中 写 数据 。 


H Jw nm 


30 áf 


i8!/usr/bin/env python 


from Tkinter import Tk 

from time import sleep 

from tkMessageBox import showwarning 
import win32com.client as win32 


warn = lambda app: showwarning(app, 'Exit?') 
RANGE = range(3, 8) 


def word(): 


app = 'Word' 

word = win32.gencache.EnsureDispatch('*s.Application' $ app) 
doc = word.Documents.Add() 

word.Visible = True 


sleep(1) 


rng = doc.Range(0,0) 

rng.InsertAfter('Python-to-$s Test\r\n\r\n' $ app) 
sleep(1) 

for i in RANGE: 


rng.InsertAfter('Line *dWNrMn' 5* i) 
sleep(1) 
rng.InsertAfter("NrMnTh-th-th-that's all folks!\r\n") 


warn (app) 
doc.Close (False) 


word.Application.Quit() 


. name zz' main ': 

Tk().withdraw() 

word() 
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ik 4 P E eA 常 相 似 ， 惟 一 的 不 同 是 我 们 要 在 文档 “范围 ?内 插入 字符 
串 ， 每 写 一 次 向 前 移动 一 下 光标 ， 而 不 是 像 在 Excel 中 那样 写 在 每 一 格 中 。 我 们 还 要 在 程序 中 
写 明 行 结 束 符 ， 也 就 是 回 车 换行 (\r\n) e 


如 果 我 们 执行 这 个 脚本 程序 ， 会 显示 如 图 23-2 的 界面 。 


Pyiton ond Test 


Line 3 
Line 4 
Line 5 
Line 6 
Line 7 


Th-th-th-that's all folks! 





23-2 Python-to-Word 示 例 和 脚本 (word.pyw) 


23.2.4 微软 PowerPoint 


在 应 用 程序 中 使 用 PowerPoint 并 不 太 常 见 ， 但 是 当 您 急于 制作 演示 文稿 的 时 候 可 能 会 考虑 使 
用 它 。 您 可 以 在 飞机 上 用 文本 文件 写 下 核心 内 容 ， 然 后 在 抵达 酒店 的 夜里 用 脚本 程序 处 理 这 
个 文件 来 自动 生成 一 系列 的 幻灯 片 。 您 其 至 可 以 通过 添加 背景 和 动画 等 东西 来 增强 效果 ， 这 
些 都 可 以 通过 COM 接 口 做 到 。 另 外 一 个 使 用 到 的 情况 就 是 当 您 不 得 不 自动 生成 或 修改 新 的 或 
已 存在 的 演示 文档 的 时 候 。 您 可 以 通过 shell 脚 本 程序 控制 COM 脚 本 来 创建 或 者 调整 每 个 生成 
的 幻灯 片 。 好 了 ， 解 释 得 够 多 了 ...... 现在 来 看 一 下 我 们 的 PowerPoint 例 子 ， 如 例 23.4 所 示 。 


您 会 再 一 次 注意 到 这 个 例子 和 上 面 的 Excel 和 Word 演 示 非 常 相 似 。PowerPoint 的 不 同 之 处 在 于 
您 写 入 数据 的 对 象 不 一 样 了 。 不 是 向 单独 的 表格 或 文档 中 写 入 数据 ，PowerPoint 更 为 复杂 ， 
因为 每 一 张 幻 灯 片 可 以 有 不 同 的 布局 。 在 一 个 演示 文档 中 ， 您 有 多 张 幻 灯 片 ， 其 中 每 一 张 纪 


灯 片 可 以 有 不 同 的 布局 (最 新 版 本 的 PowerPoint 有 30 种 不 同 的 布局 ) 。 你 可 以 进行 的 操作 依 
您 所 选 的 布局 不 一 样 而 各 有 不 同 。 


在 本 例 中 ， 我 们 选用 一 个 只 有 标题 和 文本 的 布局 (1741). ， 并 填充 主 标题 《19~20 行 ) ， 即 
Shape[0] 或 Shape (1) 一 一 Python 的 下 标 从 0 开始 ， 微 软 的 软件 从 1 开始 然后 填充 文本 
(22—2641) ， 即 Shape[1] 或 Shape (2) 。 为 了 了 解 要 使 用 哪 一 个 常量 ， 你 需要 一 个 所 有 可 
用 的 常量 列表 。 例 如 ，ppLaycmtText 常 量 的 值 被 定义 为 2 (ZA) ,ppLayoutTitle 为 1， 等 等 。 
你 可 以 在 大 多 数 微软 VB/Office 编 程 的 书 中 或 根 f 名 字 在 线 查找 相关 的 定义 。 或 者 ， 你 也 可 以 直 
接 使 用 整 型 值 ， 而 不 使 用 win32.coristaiits 中 的 名 字 。 





例 23.4 PowerPoint 示 例 (ppoint.pyw) 


这 个 脚本 启动 PowerPoint 并 在 幻灯 片 中 写 入 一 些 数据 。 


$!'/usr/bin/env python 


from Tkinter import Tk 
from time import sleep 


1 
2 
3 
4 
5 from tkMessageBox import showwarning 
6 import win32com.client as win32 

- 

8 warn = lambda app: showwarning(app, 'Exit?') 


9 RANGE = range(3, 8) 


11 def ppoint(): 


12 app = 'PowerPoint' 

13 ppoint = win32.gencache.EnsureDispatch('$s.Application' $ app) 
14 pres = ppoint.Presentations.Add() 

15 ppoint.Visible = True 

16 

17 sl = pres.Slides.Add(1, win32.constants.ppLayoutText) 
18 sleep(1) 

19 sla = sl.Shapes[0].TextFrame.TextRange 

20 sla.Text = 'Python-to-*s Demo' €* app 

21 sleep(1) 

22 slb = sl.Shapes[1].TextFrame.TextRange 

23 for i in RANGE: 

24 slb.InsertAfter("Line $dWMrMn" % i) 

25 sleep(1) 

26 slb.InsertAfter("MrWMnTh-th-th-that's all folks!") 
27 

28 warn (app) 

29 pres.Close() 

30 ppoint.Quit() 

31 

32 if | name --' main ': 

33 Tk().withdraw() 

34 ppoint.() 


23.2.5 £44. Outlook 


最 后 ， 我 们 给 出 一 个 Outlook 的 例子 ， 它 使 用 了 比 PowerPoint 例 子 更 多 的 常量 ， 作 为 一 个 十 分 
常见 和 通用 的 工具 软件 ， 在 应 用 程序 中 使 用 Outlook 非 常 有 意义 ， 这 与 uM NE o 
总 是 有 电子 邮件 地 址 、 邮 件 和 其 他 数据 可 以 在 Python 程序 中 轻松 地 处 理 。 例 23.5 就 是 Outlook 
的 一 个 例子 ， 但 是 比 前 面 的 例子 都 要 复杂 一 点 。 


在 这 个 例子 中 ， 我 们 用 Outlook 给 自己 发 了 一 封 电 子 邮 件 。 为 了 更 好 地 演示 这 个 例子 ， 你 需要 
先 关闭 网 络 访问 ， 以 确保 你 的 email 并 不 会 点 正 被 发 送出 去 ， 这 样 ， 你 就 可 以 在 发 件 箱 里 看 到 
这 封 邮件 (如 果 需 要 的 话 ， 还 可 以 在 看 完 后 删除 它 ) 。 启 动 Outlook 后 ， 我 们 写 一 封 新 的 电子 
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邮件 ， 然 后 填 好 各 个 栏 ， 例 如 收 信 人 、 主 题 和 信件 内 容 等 《15~21 行 ) 。 然 后 调用 send() 


(2241) 将 信和 存储 到 发 件 箱 ， 在 这 里 ， 信 件 一 旦 被 确实 发 送 到 邮件 服务 器 上 ， 就 会 被 移动 
到 "已 发 送 ”。 


wa 


| Microsoft PowerPoint - [Presentationt] Paal p i 





Python-to-PowerPoint Demo 








Une 3 
* Line 4 
. Line 5 
* Line 6 
Line ? 


Th-th-th-that's all folks! 


图 23-3 Python-to-PowerPointz | 9p Æ% ( ppoint.pyw) 


像 PowerPoint 一 样 ，Outlook 有 很 多 可 以 使 用 的 常量 ...... olMailltem (其 值 为 0) 常量 被 用 于 电 
子 邮 件 信息 。 其 他 常用 的 Outlook 常 量 有 : olAppointmentltem (1) ,> olContactltem (2) ^ 
olTaskltem (3) 。 当 然 ， 还 有 很 多 没有 一 一 列 出 ， 你 可 以 在 介绍 VB/Office 编 程 的 书 中 或 者 在 
线 文 档 中 查找 相关 常量 的 定义 。 


下 一 部 分 (24~27 行 ) ， 我 们 使 用 了 另 一 个 常量 olFolder Outbox (4) ， 来 打开 并 显示 发 件 箱 
目录 ， 我 们 找到 最 新 的 几 封 邮件 (有 可 能 是 我 们 刚刚 创建 的 ) 并 显示 它们 。 其 他 几 个 常用 的 
目录 有 : olFolderlnbox (6) 、olFolderCalendar (9) 、olFolderContacts (IO) ^ 
olFolderDrafts (16) 、olFolderSentMail (5) 和 olFolderTasks (13) 。 如 果 你 使 用 动态 调 
用 ， 你 可 能 要 使 用 具体 的 数值 ， 而 不 是 常量 的 名 字 ( 见 之 前 的 核心 笔记 ) o 


4123.5 Outlook 例子 (olook.pyw) 
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这 个 脚本 启动 Qiitlook， 创 建 一 封 邮件 ，“ 发 送 " 这 封 邮 件 ， 并 允许 你 打开 发 件 箱 浏览 这 
件 。 
1 #!/usr/bin/env python 
2 
3 from Tkinter import Tk 
4 from time import sleep 
5 from tkMessageBox import showwarning 
6 import win32com.client as win32 
> 
8 warn = lambda app: showwarning(app, 'Exit?') 
9 RANGE = range(3, 8) 
10 
11 def outlook(): 
12 app * 'Outlook' 
13 olook = win32.gencache.EnsureDispatch('*s.Application' ¢ app) 
14 
15 mail = olook.CreatelItem(win32.constants.olMailItem) 
16 recip = mail.Recipients.Add('you8127.0.0.1') 
17 subj = mail.Subject = 'Python-to-*s Demo' % app 
18 body = ["Line *d" * i for i in RANGE] 
19 body.insert(0, '%s\r\n' $ subj) 
20 body.append("NrMaTh-th-th-that's all folks!") 
21 maíl.Body = 'NrMn*. join (body) 
22 mail.Send() 
23 
24 ns * olook.GetNamespace ("MAPI") 
25 Obox = ns.GetDefaultFolder(win32.constants.olFolderOutbox) 
26 obox.Displayt() 
4] obox.Items.Item(1).Display() 
28 
29 warn (app) 
30 olook.Quit() 
31 
32 if name --' main ': 
33 Tk().withdraw() 
34 outlook () 
图 23-4 为 邮件 窗口 的 截图 
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Python-to- -Dutlook Demo 


Line 
Line 
Line 
Line 
Line 


Th-th-th-that's all folks! 





图 23-4 Python-to- Outlook 示 例 脚 本 (olook.pyw ) 


由 于 以 前 的 Outlook 总 是 被 用 于 各 种 各 样 的 攻击 中 ， 微 软 在 Dutlook 中 加 入 了 一 些 保护 措施 ， 来 

限制 对 通讯 簿 的 访问 以 及 代表 你 发 送 邮件 。 当 外 部 程序 想 要 访问 你 的 Outlook 的 数据 的 时 候 ， 

会 弹出 一 个 如 图 23-5 所 示 的 对 话 框 ， 以 征 取 你 的 同意 。 

当 你 想 要 用 外 部 程序 发 送 邮 件 的 时 候 ， 你 会 看 到 一 个 如 图 23-6 所 示 的 警告 对 话 框 。 你 必需 等 

到 计时 器 倒数 结束 后 才能 点 击 " 确 定 "按钮 。 

一 旦 你 完成 了 所 有 安全 检查 ， 其 他 所 有 的 事 都 能 很 顺利 地 完成 。 也 有 一 些 软件 可 以 帮助 你 绕 
过 这 些 检 查 ， 但 它们 需要 单独 下 载 和 安装 。 


在 本 书 的 网 站 http://corepython.com 上 ， 你 能 找到 一 个 把 这 所 有 4 个 小 脚本 集成 在 一 起 的 一 个 
脚本 ， 人 允许 用 户 选 择 要 运行 哪 一 个 示例 。 
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Microsoft Office Qutlook 





图 23-5 _ Outlook 地 址 薄 访 问 警告 


i Microsoft Office Qutlook 





图 23-6 _ Outlook 电子 邮件 传输 警告 


23.2.0 中 等 规模 的 例子 


现在 ， 我 们 对 Office 编 程 已 经 有 了 一 些 概念 ， 接 下 来 ， 我 们 要 把 本 节 所 列 的 知识 与 Web 服 务 那 
一 节 的 知识 组 合 起 来 ， 写 一 个 更 实用 的 应 用 程序 。 如 果 我 们 把 股票 报价 的 例子 与 Excel 演示 脚 
本 合 起 来 ， 就 能 形成 一 个 能 从 网 上 下 载 股 票 报价 ， 并 把 结果 直接 放 到 Excel 中 的 应 用 程序 ， 而 
不 用 把 数据 放 在 CSV 文 件 中 作为 中 介 。 


逐 行 解释 
1~13 行 


我 们 导入 股票 报价 和 Excel 脚 本 两 个 例子 中 的 所 使 用 的 模块 与 常量 。 
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15 ~ 32 行 


核心 功能 的 第 一 部 分 是 像 之 前 那个 脚本 (17—214T) 那样 启动 Excel。 把 标题 和 时 间 写 到 相应 
的 单元 格 中 (23~2947) ， 然 后 是 粗 体 (30 行 ) 的 列 的 头 。 从 第 6 行 开 始 (32 行 ) 的 单元 格 
会 写 入 实际 的 股票 报价 的 数据 。 


34 ~ 43 行 


如 同 之 前 一 样 ， 打 开 一 个 URL (34 行 ) ， 但 不 再 把 结果 写 到 标准 输出 ， 我 们 把 结果 十 到 电子 
表格 的 单元 格 中 。 一 次 放 一 列 数据 ， 每 行 一 个 公司 的 股票 信息 (35~42 行 ) 。 


45 ~ 51 行 
脚本 的 剩 下 几 行 作用 与 之 前 看 到 的 一 样 。 
例 23.6 ”股票 报价 与 Excel 例 子 (estock.pyw) 


这 个 脚本 从 Yahoo ! 下 载 股票 报价 并 把 数据 写 入 到 Excel。 
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f! /usr/bin/env python 


from Tkinter import Tk 

from time import sleep, crime 

from tkMessageBox import showwarning 
from urllib import urlopen 

import win32com.client as win32 


warn * lambda app: showwarning(app, 'Exit?') 
RANGE * range(3, 8) 

TICKS = ('YHOO', 'GOOG', 'EBAY', 'AMZN') 
COLS = ('TICKER', 'PRICE', 'CHG', '$AGE') 


URL = 'http://qucote.yahoo.com/d/quotes.csv?s"-$s&f"sllclp2' 


def excel(): 
app * 'Excel' 


xl = win32.gencache,EnsureDispatch('*s.Application' ¢ app) 


ss = xl.Workbooks.Add() 
sh = ss.ActiveSheet 

xl. Visible = True 
sleep(1) 


sh.Cells(1, 1).Value = 'Python-to-*s Stock Quote Demo' $ app 


sleep (1) 


sh.Cells(3, 1).Value = 'Prices quoted as cf: $s' % ctime() 


sleep(1) 
for i in range(4): 

sh.Cells(5, i*1).Value = COLS[i] 
sleep(1) 


sh.Range(sh.Cells(5, 1), sh.Cells(5, 4)).Font.Bold * True 


sleep(1) 
row = 6 


u = urlopen(URL % ','.join(TICKS)) 
for data in u: 


tick, price, chg, per = data.split(',') 


sh.Celis(row, 1).Value = eval (tick) 


sh.Cells(row, 2).Value = ('*.2f' * round(float(price), 2)) 


sh.Cells(row, 3).Value = chg 


sh.Cells(row, 4).Value = eval(per.rstrip()) 


row += 1 
sleepí1) 
f.close() 
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44 

45 warn (app) 

46 ss.Close(False) 

47 xl.Application.Quit() 
48 

49 if name --' main ': 
50 Tk().withdraw() 

51 excel () 







thon-t | xcel Stock Quote Demo 
Prices quoted as of. Sat May 27 02:34:32 2006 | “ 国 


TICKER PRICE CHG — *AGE 
S YHOO | 302 01 030% 


EMIGOOG | 38135 -1.64 -0439  — ^" 
B EBAY —— 342 — 032 0.94% "| 
9 [AMZN 36.07 044 123% d 





图 23-7 Python-to-Excel 股 票 报价 示例 脚本 (estock.pyw ) 


注意 ， 存 放 数 字 的 那 几 列 的 原始 格式 信息 已 经 没有 了 ， 因 为 Excel 用 默认 的 单元 格格 式 把 它们 
存 为 数字 了 。 我 们 把 数字 的 格式 改 为 保留 小 数 点 后 两 位 。 例 如 ， 虽 然 Python 传 递 的 

是 “34.20”， 但 显示 的 时 候 ， 还 是 显示 “34.2?。 而 " 自 上 次 收盘 的 变动 ? 那 一 列 ， 则 不 仅 少 了 小 数 
点 后 的 数字 ， 而 且 数字 前 面 的 用 于 表示 升值 的 正 号 〈+) 也 没 了 (这 是 Excel 的 输出 和 原始 文 
本 版 的 比较 。 这 些 问题 在 本 章 结 尾 的 练习 中 有 详细 说 明 ) 。 


23.3 用 Jython 写 Python 和 Java 的 程序 
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23.3.4 什么 是 Jython 


Jython 是 一 种 可 以 把 两 种 不 同 的 编程 语言 结合 在 一 起 的 工具 。 首 先 ， 它 使 Python 程序 € 
AJNA AT A PENE E A dcm OHNE TUAE UN SISUA TIN Ja T NUUS 

次 ， 它 能 在 Java 中 加 入 脚本 语言 ， 2 00 20525 E 
员 们 再 也 不 用 为 他 们 刚 写 的 一 个 类 写 一 大 堆 的 测试 用 例 或 驱动 程序 。 


Jython 提 供 了 Python 的 大 部 分 功能 ， 以 及 实例 化 Java 类 并 与 Java 类 交互 的 功能 。Jython 代 码 
被 动态 地 编译 成 Java 字 节 码 ， 因 此 ， 你 可 以 用 Jython 扩 展 Java 类 ， 也 可 以 用 Java 来 扩展 
Python。 在 Python 中 写 一 个 类 ， 像 使 用 Java 类 一 样 使 用 这 个 类 是 很 容易 的 事情 。 你 甚至 可 以 
把 Jython 脚 本 静态 地 编译 为 Java 字 节 码 。 
人 
件 的 默认 启动 注意 事项 后 ， 局 动 Jython 的 交互 解释 器 就 跟 用 Python 一 样 简单 。 而 有 全， 你 也 可 
以 像 在 Python 中 一 样 ， 写 一 个 “Hello World!": 


$ jython 
Jython 2.2al on javal.4.2 09 (JIT: null) 


Type "copyright", "credits" or "license" for more 
information. 

>>> print 'Hello World!' 

Hello World! 

>>> 

>>> import sys 

>>> sys.stdout.write('Hello World!\n') 

Hello World! 


惟一 的 不 同 是 ， 现 在 ， 你 不 得 不 等 待 Java 那 超 长 的 启动 时 间 。 如 果 你 能 忍受 这 个 ， 你 就 能 做 
一 些 更 有 用 的 事 了 。 用 Jython 交 互 解释 器 的 一 个 更 有 趣 的 方面 就 是 ， xt 你 可 以 用 Java 来 
写 “Hello World" 了 : 

>>> from java.lang import System 


>>> System.out.write('Hello World! \n') 
Hello World! 


Java 给 了 Python 用 户 一 些 额 外 的 好 处 ， 即 可 以 使 用 本 地 异常 处 理 (这 在 标准 Python 一 一 相对 
于 其 他 实现 来 说 ， 也 被 称 为 “CPython” 一 一 里 是 没有 的 ) ， 以 及 可 以 使 用 Java 的 垃圾 收集 器 
(这 样 就 没 必要 再 为 Java 开 发 一 套 Python 的 实现 了 ) 。 


23.3.3 Swing GUI 开发 (Java 或 者 Python!) 


有 了 对 所 有 Java 类 的 访问 能 力 ， 我 们 能 做 的 事 就 太 多 了 ， 例 如 ， 图 形 界 面 (GUI) 的 开发 。 在 
Python 中 ， 我 们 用 Tkinter 模 块 中 的 Tk 作 为 默认 GUI， 但 是 ，Tk 不 是 Python 的 本 地 工具 包 。 不 
过 ，Java 有 Swing， 它 是 本 地 的 。 用 Jython， 我 们 可 以 用 Swing 组 件 写 一 个 GUI 应 用 程序 ， 不 
是 用 Java， 而 是 用 Python ° 


一 个 简单 的 “Hello World!" GUI 程序 的 Java 版 本 和 对 应 的 Python 版 本 分 别 在 例 23.7 和 例 23.8 中 
给 出 。 这 两 个 版 本 都 模仿 了 图 像 界 面 编程 那 一 章 的 Tk 例 子 tkhello3.py。 这 两 段 程序 分 别 叫 
swhellojava 和 swhello.py. 


例 23.7 在 Java 中 ,用 Swing 写 “Hello World” (swhello.java) 
本 程序 像 tkhello3.py 那 样 ， 创 建 一 个 GUI。 使 用 Swing 而 不 是 Tk， 使 用 的 语言 是 Java 。 


import java.awt.*; 
import java.awt.event.*; 
import javax.swing.*; 


import java.lang.*; 


U^ 4. Uc N m 


6 public class swhellco extends JFrame | 


7 JPanel box; 

8 JLabel hello; 

9 JButton quit; 

10 

11 public swhello() ( 

2 super ("JSwing"); 

13 JPanel box = new JPanel(new BorderLayout()); 
l4 JLabel hello = new JLabel("Hello World!"); 
15 JButton quit = new JButton ("QUIT"); 

16 

17 ActionListener quitAction = new ActionListener() | 


18 public void actionPerformed(ActionEvent e) { 
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19 System.exit (0); 

20 } 

21 a 

22 quit.setBackground (Color.red); 

23 quit.setForeground (Color.white); 

24 quit.addActionListener(quitAction); 
25 box.add(hello, BorderLayout.NORTH); 
26 box.add(quit, BorderLayout.SOUTH); 
27 

28 addWindowListener(new WindowAdapter() (| 
29 public void windowClosing(WindowEvent e) 
30 System.exit (0); 

31 ) 

32 n: 

33 getContentPane ().add (box) ; 

34 pack(): 

35 setVisible (true); 

36 ] 

37 

38 public static void main(String args[]) 1 
39 swhello app = new swhello(); 

40 } 

41 ) 


1423.8 在 Python 中 用 Swing 写 “Hello World” (swhello.py ) 


下 面 的 Python 脚本 代码 具有 和 上 面 的 Java 程 序 具 有 相同 的 功能 ， 需 要 在 Jython 解 释 器 中 执 


行 。 
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1 $'/usr/bin/env jython 

2 

3 from Pawt import swing 

4 import sys 

5 from java.awt import Color, BorderLayout 

6 

7 def quit(e): 

8 sys.exit() 

9 

10 top = swing.JFrame ("PySwing") 

11 box = swing.JPanel|() 

12 hello = swing.JLabel("Hello World!") 

13 quit = swing.JButton("QUIT", actionPerformed-quit, 
14 background-Color.red, foregroundsColor.white) 
15 

16 box.add("North", hello) 

17 box.add("South", quit) 

18 top.contentPane.add (box) 

19  top.pack() 

20 top.visible = 1 # or True for Jython 2.2+ 


两 段 代码 都 与 tkhello3.py 一 一 致 ， 惟 一 的 区 别 就 是 它们 使 用 了 Swing 而 不 是 Tk。Python 版 本 的 
特点 是 ， 做 同样 的 事 ，Python 所 要 写 的 代码 相对 于 Java 大 幅 减 少 。Python 代 码 的 表达 能 力 更 

强 ， 所 以 每 一 行 都 显得 更 为 重要 。 简 单 地 说 ， 就 是 “白色 噪音 ”( 译 者 注 : 指 Java 大 量 换行 造成 
的 留 白 部 分 ) 更 少 了 。Java 的 代码 更 趋向 于 用 更 多 的 “样板 "代码 来 完成 工作 ， 而 Python 则 让 你 
把 注意 力 集 中 在 你 的 应 用 的 重要 部 位 ， 即 你 要 解决 的 问题 的 解决 方案 上 。 


由 于 两 个 程序 都 会 被 编译 为 Java 字 节 码 ， 在 同一 个 平台 上 两 个 程序 看 上 去 完全 一 样 也 就 没 什 
么 好 奇怪 的 了 (ILE23-8) ° 
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., 0 6 Jswing . 


Macos x Halo World 









Java Python 


图 23-8 Swing 的 Hello World 示 例 脚 本 (swhello.java 和 swhello.py) 


Jython 是 一 个 很 伟大 的 工具 。 因 为 你 可 以 同时 得 到 了 Python 的 强大 的 表达 能 力 ， 以 及 Java 库 
中 丰富 的 API。 如 果 你 现在 是 一 个 Java 程 序 员 Te 对 你 身后 Python 的 强大 
力量 的 兴趣 。 如 果 你 是 Java 新 手 ，Jython 能 让 你 更 为 轻松 。 你 可 以 用 Jython 写 原型 ， 然 后 在 
必要 的 时 候 轻 松 地 移植 到 Java 中 。 


23.4 练习 


Web 服 务 


23-1. Web 服 务 。 使 用 yahoo ! 股票 报价 示例 (stoclcpy) 并 把 这 个 程序 改 为 把 报价 数据 
保存 到 一 个 文件 中 ， 而 不 在 屏幕 上 显示 。 可 选 题 : 你 可 以 修改 脚本 ， 让 用 户 可 以 选择 是 显 
示 报 价 还 是 保存 到 文件 中 。 


23-2.Web 服 务 。 |! 股票 报价 示例 (stocLpy) ， 让 程序 可 以 下 载 上 面 所 列 的 其 
他 参数 数据 。 可 选 题 : 你 可 以 把 这 个 功能 加 到 上 一 题 的 程序 中 。 


23-3.Web 服 务 和 CSV 模块 。 修 改 stock.py， 像 我 们 在 示例 代码 中 那样 ， 使 用 csv 模 块 来 
解析 得 到 的 数据 。 附 加 题 : 用 同样 的 方法 修改 这 个 脚本 的 Excel 版 本 (estock.py) ° 


23-4.REST 与 Web 服 务 。 学 习 现 在 的 Web 服 务 API 和 应 用 程序 中 ，REST 与 XML 是 如 何 被 
使 用 的 。 与 老式 的 Web 服 务 ， 像 Yahoo ! 报价 服务 这 种 用 URL 参 数 的 方式 相 比 较 ， 额 外 
提供 了 哪些 功能 。 


23-5.REST 与 Web 服 务 。 利 用 Python 对 REST 和 XML 的 支持 ， 创 建 一 个 应 用 程序 的 框架 ， 
这 个 框架 要 能 在 写 使 用 如 今 这 些 更 新 的 Web 服 务 和 API| 应 用 程序 的 时 候 ， 能 实现 代码 的 共 
享 和 重用 。 展 示 你 的 使 用 Yahool、Google、eBay 及 (或 ) Amazon 服务 的 代码 。 


微软 Office 编 程 
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23-6. 微 软 Excel 和 网 页 。 创 建 一 个 应 用 程序 ， 读 取 Excel 电 子 表格 中 的 数据 ， 并 生成 一 个 
对 应 的 HTML 表 格 〈 你 可 能 需要 第 三 方 的 HTMLgen 模 块 ) 。 


23-7 .微软 Office 应 用 程序 与 Web 服 务 。 连 接 到 任何 现 有 的 Web 服 务 ， 无 论 是 基于 REST 还 
是 URL 的 ， 并 把 数据 写 到 Excel 电 子 表格 中 ， 或 设置 一 个 比较 好 看 的 格式 ， 然 后 放 到 Word 
文档 中 。 格 式 要 适 于 打印 。 附 加 题 : 要 同时 支持 Excel 和 Word ° 


23-8. 微 软 Outlook 和 Web 服 务 。 与 之 前 的 问题 相似 ， 做 同样 的 事情 ， 并 把 数据 放 到 一 封 新 
的 电子 邮件 中 ， 并 用 Outlook 发 送出 去 。 附 加 题 : 做 同样 的 事 ， 但 是 用 普通 的 SMTP 服 务 
器 来 发 送 电子 邮件 ， 而 不 使 用 Outlook (你 可 能 想 要 参考 第 17 章 Internet 客 户 端 编程 ) 。 


23-9. 微 软 PowerPoint。 设 计 一 个 演示 文档 生成 器 。 设 计 一 种 用 Word 或 普通 文本 编辑 器 就 
能 生成 的 文本 文件 的 格式 。 从 遵循 该 格式 的 文本 文件 中 ， 读 出 要 演示 的 数据 ， 并 生成 对 
应 的 PowerPoint 幻 灯 片 放 在 一 个 演示 文档 中 。 


23-10. 微 软 Dutlook、 数 据 库 和 你 的 地 址 簿 。 写 一 个 程序 ， 从 Outlook 的 地 址 簿 中 读 出 数 
据 ， 把 想 要 的 字段 保存 到 数据 库 中 。 数 据 库 可 以 是 一 个 文本 文件 、DBM 文 件 或 是 一 个 关 
系数 据 库 (你 可 能 想 要 参考 第 21 章 ) 。 附 加 题 : 完成 反 向 的 工作 。 即 从 数据 库 (或 允许 
用 户 直 接 输 入 ) 中 读 取 联 系 人 的 信息 ， 添 加 或 更 新 记录 到 Outlook 中 。 


23-11. 微 软 Outlook 和 电子 邮件 。 开 发 一 个 程序 读 取 收 件 箱 和 (或 ) 其 他 重要 的 文件 夹 的 
数据 ， 并 把 它们 用 普通 的 “box“ 格 式 保存 到 磁盘 上 。 


23-12. 微 软 Outlook 日 历 。 写 一 个 脚本 创建 新 的 Outlook 任 务 。 至 少 要 允许 用 户 输 入 以 下 信 
息 : 开始 日 期 和 和 时间、 任务 名 字 或 主题 及 任务 持续 时 间 。 


23-13. 微 软 Outlook 日 历 。 创 建 一 个 应 用 程序 ， 导 出 你 的 所 有 任务 信息 到 一 个 你 指定 的 地 
方 ， 如 屏幕 上 、 数 据 库 中 和 Excel 中 等 。 附 加 题 : 程序 也 要 可 以 导出 Outlook 任 务 。 


23-14. 多 线程 。 修 改 股票 报价 下 载 脚本 (estocLpyw) ， 使 用 多 个 Python 线程 ， 让 数据 下 
载 部 分 可 以 并行“。 可 选 题 : 你 也 可 以 试用 win32process.beginthreadex() 产 生 
VisualC++ 的 线程 来 完成 本 题 。 


23-15.Excel 单 元 格格 式 。 在 股票 报价 下 载 脚本 (estock.pyw) 的 电子 表格 版 本 中 ， 我 们 
在 图 23-7 中 看 到 股票 价格 并 不 是 默认 到 小 数 点 后 两 位 ， 就 算 我 们 传 进去 的 是 有 后 组 0 的 也 
不 行 。 当 Excel 把 这 个 字符 串 转 为 数字 的 时 候 ， 就 自动 使 用 数字 格式 的 设 定 。 (a) 把 单 
元 格 的 NumberFormat 属 性 设 为 “0.00“ 就 可 以 把 数字 的 格式 正确 的 设 定 为 两 个 小 数位 。 

(b) 我 们 也 看 到 “change from previous close， 那 一 列 除 了 小 数 点 后 的 小 数 之 外 ， 还 丢 
了 “+“ 号 。 可 是 ， 方 法 (a) 中 的 修正 方法 只 能 解决 小 数 点 后 的 小 数 的 问题 。 对 所 有 的 数 
字 ， 那 个 “+"“ 号 都 会 被 自动 丢掉 。 解 决 方法 是 ， 把 这 一 栏 设 为 文本 ， 而 不 是 数字 。 你 可 以 
把 单元 格 的 NumberFormat 属 性 设 为 " @ “来 解决 这 个 问题 。 (c) 问题 是 ， 把 单元 格 的 格 
式 由 数字 改 为 文本 的 一 个 问题 是 ， 我 们 丢失 了 数字 的 自动 对 齐 方 式 。 在 (b) 的 解决 方案 
之 外 ， 还 要 再 设置 单元 格 的 HorizontalAlignment 属 性 为 Win32Excel 的 xIRight 常 量 。 当 你 
完成 了 上 面 三 部 分 后 ， 你 的 输出 结果 看 上 去 就 更 令 人 满意 了 ， 如 图 23-9 所 示 。 
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图 23-9 改进 Python-to-Excel 股 票 报价 脚本 (estock.pyw ) 
Java ` Python ` Jython 
23-16.Jython.Jython 与 CPython 的 区 别 是 什么 ? 


23-17.Java 和 Python。 选 一 个 已 经 存在 的 Java 应 用 程序 ， 移 植 到 Python 中 。 在 日 记 中 写 
下 你 的 经 验 。 完 成 后 ， 总 结 一 下 ， 都 有 哪些 事 是 必需 要 做 的 ， 最 重要 的 步骤 是 什么 ， 移 
植 的 中 一 定 要 做 的 ， 公 共 的 部 分 有 哪些 。 


23-18.Java 和 Python。 研 究 Jython 的 源 代 码 。 描 述 一 些 Python 标 准 类 型 是 如 何在 Java 中 
实现 的 。 


23-19.Java 和 Python。 用 Java 写 一 个 扩展 来 扩展 Python。 哪 几 步 是 必要 的 ?在 Jython 交 
互 解释 器 中 演示 你 的 结果 。 


23-20.Jython 和 数据 库 。 从 第 21 章 中 找到 一 个 比较 有 意思 的 练习 ， 移 植 到 Jython 中 。 
Jython 最 好 的 一 件 事 就 是 ， 从 2.1 版 本 开始 ， 它 自 带 了 一 个 JDBC 数 据 库 模块 叫 zxJDBC ， 
而 且 它 基 本 上 遵循 Python DB-API 2.0 版 本 协议 。 


23-21.Python 和 Jython。 找 到 一 个 目前 Jython 中 还 没有 的 Python 模块 ， 并 移植 它 。 考 上 处 
把 移植 的 结果 作为 一 个 补丁 提交 给 Jython 发 布 版 。 


[1] 注 1: Mash-ups， 有 人 译作 “混搭 "或 “混搭 式 网 站 ”， 意 为 通过 多 源头 信息 整合 完成 的 服 
务 。 是 与 维基 (Wiki) 、 网 志 (Blog) 并 举 的 Web2. 0 技术 。 目 前 最 典型 的 代表 是 
Google。 


[2] 注 2 : 本 章 中 的 Yahoo ! 服务 均 来 自 “ 雅 虎 " 而 不 是 “雅虎 中 国 " 为 了 不 让 读者 混淆 ， 以 及 
能 随 本 书 进行 相关 实践 ， 故 而 Yahoo 没 有 翻译 成 “雅虎 "各 项 服务 名 称 也 保留 了 原文 。 
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